데이터 값들이 어떻게 퍼져 있는지를 나타내는 패턴

분포

정의

분포(distribution)는 데이터 집합에서 각 값이 얼마나 자주 나타나는지를 나타내는 개념입니다. 정규분포처럼 평균을 중심으로 좌우 대칭인 경우도 있고, 소득 분포처럼 한쪽으로 치우친 경우도 있습니다. 분포의 형태를 파악하면 평균·중위값 중 어떤 대표값이 적절한지 판단할 수 있습니다.

한국 사례

소득 분포는 대부분의 사람이 낮은 소득 구간에 몰리고 소수가 매우 높은 소득을 가진 우측 꼬리 분포를 보이는 경향이 있습니다.