iBetter Books
수정

03장. 분포 차트

"이 데이터, 어디에 몰려 있을까?"

분포 차트는 단 하나의 변수가 어떻게 퍼져 있는지 보여줍니다. 값이 10~20 사이에 주로 있는지, 아니면 고르게 퍼져 있는지, 양쪽 끝에 극단값이 있는지를 파악합니다.

그룹을 비교하는 것이 아니라, 한 변수 자체의 형태를 탐색하는 단계에서 분포 차트를 씁니다.

이 장의 구성

함수 핵심 아이디어
01 histplot 데이터를 구간으로 나누어 빈도를 막대로 표현
02 kdeplot 히스토그램을 부드러운 곡선으로 추정
03 ecdfplot, rugplot 누적 비율과 개별 데이터 위치 확인