반응형

주식 차트 등에서 통계적 추론 과정을 설명하는 문장 중에

가끔 Robust 하다는 이야기가 나온다.

 

필자도 학교를 졸업한지 꽤 되어서...

어디서 들어본 단어인데... 뭐지? 

커피의 Arabica(아라비카) 종이랑 Robust(로버스트) 종이 있는데 여기서 로버스트인가?

이런 생각을 하면서 검색을 해보니..

 

헉 대충 맞았다.

Robust의 사전적 의미는 강건한...

 

 

구조적으로 튼튼하고 건강하여 어떤 이상(abnormal) 영향을 받아도 

체계가 흔들리지 않는 튼튼함을 이야기하는 것인데,

 

통계에서는 평균을 내거나 추세선을 그릴 때 

뭔가 예외적으로 특이한 Data가 들어오더라도 해당 평균과 추세에 큰 영향을 받지 않는

통계 산출 기법의 튼튼함을 이야기 한다.

 

 

예를 들어 특정 집단에 9명이 있고

이 9명의 월급이 모두 300~310만원 사이라고 가정 한다면

이 집단의 일반적인 평균 월급은 약 305만원 정도가 될 것이다.

 

하지만 이 집단에 월급 1억원을 받는 사람을 포함시킨다면

이 집단의 일반적인 평균 월급은 갑자기 9천만원 이상이 될 것이다.

 

 

10명의 집단 구성원 중 9명은 300만원을 벌고 있는데

단 1명이 1억원을 벌었다고 이 집단의 평균 월급이 9천만원이라고?

 

이런 경우 단순 평균값은 Robust 하지 않다고 표현할 수 있다.
(평균의 함정이라고도 한다)

 

 

이럴때는 Median(중앙값)을 사용할 수 있는데..

A : 300만원 / B : 301만원 / C : 302만원 / D : 303만원 / E : 304만원

F : 305만원 / G : 306만원 / H : 307만원 / I : 310만원 / J : 1억원 

 

이 경우 305만원 정도가 Median 값이 되어 

이 집단의 평균 월급 규모를 좀 더 현실에 가깝게 드러내 주는데

이때 Median 값으로 평균을 내는 방식이 

통계적으로 Robust 하다고 표현하는 것이다.

 

반응형

+ Recent posts