PART 02. 다양한 차트
민서는 처음 만든 산점도를 팀 발표 자료에 붙여 넣었습니다. 발표가 끝나고 교수님이 한마디 했습니다.
"민서 씨, 이 데이터는 산점도도 좋지만, 분포를 보여주는 차트도 함께 넣으면 더 설득력이 있을 것 같은데요."
민서는 순간 멈췄습니다. 산점도 하나만 만들 줄 알게 됐다고 다 된 줄 알았는데, 차트의 종류가 이렇게 많을 줄이야.
강주원 선배가 옆에서 소곤거렸습니다.
"데이터가 무엇을 말하고 싶은지에 따라 차트가 달라져. 관계를 보고 싶으면 산점도, 분포를 보고 싶으면 히스토그램, 그룹을 비교하고 싶으면 박스플롯. 차트는 도구야. 목적에 맞게 골라야 해."
민서는 그날 집에 돌아와 노트에 적었습니다. "차트를 만드는 게 아니라, 데이터의 이야기를 찾는 것."
이 파트에서 민서와 함께 Seaborn이 제공하는 다양한 차트를 하나씩 배워봅니다. 각 차트가 어떤 질문에 답하는지, 언제 써야 하는지를 중심으로 살펴봅니다.
학습 목표
이 파트를 마치면 다음을 할 수 있습니다.
- 데이터의 성격(연속형/범주형/시계열)에 따라 알맞은 차트를 선택할 수 있습니다.
- 관계형, 범주형, 분포형, 회귀형, 행렬형 차트를 각각 코드로 작성할 수 있습니다.
- 두 변수 사이의 관계, 그룹 간 차이, 데이터의 퍼짐 정도를 시각화할 수 있습니다.
- 차트 선택 의사결정 기준을 갖출 수 있습니다.
이 파트의 구성
| 장 | 제목 | 핵심 함수 | 다루는 질문 |
|---|---|---|---|
| 01장 | 관계 차트 | scatterplot, lineplot, relplot | 두 변수는 어떤 관계인가 |
| 02장 | 범주형 차트 | barplot, countplot, boxplot, violinplot, swarmplot | 그룹 간 차이가 있는가 |
| 03장 | 분포 차트 | histplot, kdeplot, ecdfplot, rugplot | 데이터는 어떻게 퍼져 있는가 |
| 04장 | 회귀 차트 | regplot, lmplot, residplot | 변수 간 추세와 예측 |
| 05장 | 행렬 차트 | heatmap, clustermap | 여러 변수 간 전체적인 관계 |
| 06장 | 차트 선택 가이드 | — | 어떤 차트를 언제 쓸까 |