Proxy를 통해야만 인터넷이 되는 환경에서 RStudio를 사용하기 위해서는 R 설정에서 Proxy 정보를 추가해야 한다.

 

RStudio Server는 R_HOME/etc/Renviron.site 에 추가하면 되고, RStudio Desktop은 ~/.Renviron 에 추가하면 된다. 

(R_HOME의 경로는 R.home() 명령으로 확인할 수 있다.)

 

RStudio에서 다음 명령어로 쉽게 수정할 수 있다.

file.edit('~/.Renviron')

위 명령어로 스크립트 창이 열리면 아래 내용을 추가한다.

http_proxy=http://proxy.dom.com/
http_proxy_user=user:passwd

https_proxy=https://proxy.dom.com/
https_proxy_user=user:passwd

http_proxy_user 또는 https_proxy_user 는 Proxy에서 계정을 통해 인증을 해야 하는 경우에만 추가하면 된다.

 

적용 후 RStudio를 재시작하면 인터넷 연결이 가능하다.

 

참조: https://support.rstudio.com/hc/en-us/articles/200488488-Configuring-R-to-Use-an-HTTP-or-HTTPS-Proxy

boxplot 사분위값을 이용하여 데이터의 분표 모양, 대칭성, 극단 값을 쉽게 파악할 있는 그림이다.

크게 중앙 50% 데이터의 분포 형태를 파악하는 부분과 나머지 50%(outlier) 분포 형태를 파악하는 부분 가지로 나누어 있다.


[5, 10,  15, 15, 16, 16, 20, 20, 20, 21, 25, 45, 50]


위의 데이터에서 사분위값은 아래와 같다


1사분위(Q1) = 15

2사분위(Q2) = 20

3사분위(Q3) = 25

(사분위값을 구하는 방법은 여러가지가 있다방법에 따라 값이 달라질  있다.)


Q1 Q3 끝으로 하는 상자를 그리고 Q2 실선으로 그어 중앙 50% 데이터가 어떻게 분포되어 있는지 나타낸.


나머지 50% 분포는 IQR 이용하여 그린다.

IQR(InterQuartile Range) 'Q1 Q3 사이 길이'이다.


Q1 Q3 주변으로 1.5 * IQR 범위에 있는 데이터를 울타리 안에 표시하고,

바깥에 있는 데이터는 * 또는 O 으로 표시한다.

(이때 울타리 안의 데이터를 'suspect outliers' 하고울타리 밖의 데이터를 'highly suspect outliers' 한다.)


IQR = 25 - 15 = 10

1.5*IQR = 15

Q1 - 1.5*IQR = 15 - 15 = 0

Q3 + 1.5*IQR = 25 + 15 = 40


위에서 구한 값을 그림으로 그리면 다음과 같다.




+ Recent posts