Table of Contents

통계

왜도Skewness/ 첨도Kurtosis

꼬꼬마코더 2024. 4. 26. 12:06
728x90

왜도skewness

데이터의 분포가 얼마나 비대칭인지 알기 위해 우리는 왜도skewness라는 표현을 씁니다. 그래프의 꼬리라고 생각하면 됩니다. 왜도값은 -1~+1까지입니다. 비대칭이 커질수록 왜도의 절대값은 커집니다.

왜도값 양수: 평균>중앙값: 평균>중앙값>최빈값인 경우가 많다, positively skewed,  right-skewed, 오른쪽으로 긍정적인 방향으로 긴 꼬리를 가지고 있다고 표현합니다. 

왜도값 음수: 평균<중앙값:  평균<중앙값<최빈값인 경우가 많다, negatively skewed, left-skewed, 왼쪽으로 부적인 방향으로 긴 꼬리를 가지고 있다고 표현합니다.

왜도값 0: 평균==중앙값(비슷한 경향), 평균=중앙값=최빈값인 경우가 많습니다.

 

첨도(Kurtosis)

첨도(Kurtosis)는 데이터 분포의 뾰족한 정도와 꼬리 부분의 두께를 나타내는 통계적 측도입니다. 첨도는 분포의 중심 주변에 데이터가 얼마나 집중되어 있는지, 그리고 꼬리가 얼마나 무거운지(Heavy-tailed) 또는 가벼운지(Light-tailed)를 측정합니다.

첨도의 종류

  1. 정규 첨도 (Mesokurtic): 첨도가 3에 가까운 분포는 정규분포와 유사한 첨도를 가집니다. 이러한 분포는 중앙에 데이터가 적당히 집중되어 있으며, 꼬리는 중간 정도의 두께를 가집니다.
  2. 뾰족한 첨도 (Leptokurtic): 첨도 값이 3보다 큰 분포는 꼬리가 무겁고 중심에 데이터가 매우 집중되어 있습니다. 이런 분포는 더 뾰족하게 보이며, 극단값을 가질 확률이 높습니다.
  3. 납작한 첨도 (Platykurtic): 첨도 값이 3보다 작은 분포는 중심 주변의 데이터 집중이 적고 꼬리가 가벼워 상대적으로 납작하게 보입니다. 이런 분포는 정규분포보다 덜 뾰족하고, 극단값을 가질 확률이 낮습니다.