본문 바로가기
Statistics

통계에서 말하는 로버스트하다?

by rubyda 2021. 2. 8.
728x90

 

 

통계 공부를 하다가 "로버스트(robust)하다" 라는 말을 접하게 되었습니다. 무슨 뜻인지 모르겠어서 우선 단어의 뜻부터 찾아보니 "건장한"이라는 뜻으로 해석이 되었습니다. 이것만 보고는 감이 잘 안와서 찾아보며 그 의미를 알아보았습니다.

 

로버스트에 대해 공부를 할때 예제를 생각하며 하니 더 빠르게 이해할 수 있었습니다. 따라서 제가 이해한 방법을 정리하고자 합니다.

 

먼저, 로버스트를 정의해보면 다음과 같습니다.

 

로버스트(robust) : "극단값들에 예민, 민감하지 않다"라고 표현을 해볼 수 있습니다.

 

 

예를들어서 한 마을에 사는 사람들의 소득이 각각 11, 14, 12, 13 이라고 가정을 해보겠습니다. 그렇다면 이 마을 평균 소득12.5가 됩니다.

 

 

그런데 만약에 엄청난 부자가 이 동네에 이사를 왔다고 해봅시다.  그 부자의 하루 소득이 500이라고 가정을 했을때 나열을 해보면 11, 14, 12, 13, 500이 되고 평균 소득110이 됩니다. 

 

부자를 제외한 일반 사람들에게는 평균값이랑은 매우 거리가 멀어 보입니다. 그렇기 때문에 이 마을 평균 소득이 110이라고 표현을 하면 납득을 하기는 어렵고, 잘못된 값처럼 보입니다.


이처럼 "다른 값에 비해 지나치게 크거나 작은값"들을 이상값이라고 부릅니다.

 

결론적으로는 이 마을을 대표하는값으로 평균값을 사용하기는 적합하지 않습니다.

 

이러한 경우 우리는 평균값을 대신하여 중앙값을 많이 사용을 합니다. 중앙값은 그 값들을 나열했을때 가운데 즉, 중앙에 오는 값들을 의미합니다.

 

나열을 해보면 11, 12, 13, 14, 500 다음과 같습니다. 이때 중앙값은 바로 13이됩니다. 어떤가요?? 평균값인 110이랑 비교했을때 이 마을을 대표하는 값으로 더 적합해 보입니다.


바로!! 이러한 상황을 봤을때 이상값에 영향을 적게 받는 값들을 보고 우리는 "로버스트(robust)하다". 라고 말합니다.

 

다시 말하자면 이상값들에 민감하지 않다는 뜻이지요!! 

 

"로버스트하다" 또는 "로버스트 방법"에 의해 추정하였습니다. 등은 주로 논문에서 많이 쓰이는 말이라고 합니다. 논문 읽을때 참고하면 좋은 언어인것 같습니다.

 


참고

 

blog.naver.com/PostView.nhn?blogId=qbxlvnf11&logNo=221493039097&redirect=Dlog&widgetTypeCall=true&directAccess=false

 

'Statistics' 카테고리의 다른 글

좋은 선형 회귀 모델이란??  (0) 2021.09.04
분산 공식 이해하기  (0) 2021.05.13
중심 경향(central tendency)  (0) 2021.03.30
다중공선성(Multicollinearity)  (0) 2020.11.12
회귀 분석 - 변수 선택과 모형 선택  (0) 2020.10.29