iBetter Books
수정

PART 05. 공공데이터 분석 프로젝트

지금까지 R의 기초 문법을 익히고, tidyverse로 데이터를 다루고, ggplot2로 시각화하는 방법을 배웠습니다. 이제 실제 데이터를 가져와서 처음부터 끝까지 분석해볼 차례입니다.

이 파트에서 사용할 데이터는 대한민국 공공데이터 포털(data.go.kr)에서 누구나 무료로 내려받을 수 있는 공개 데이터입니다. 서울시 지하철 승하차 인원, 주민등록 인구 통계처럼 우리 생활과 밀접한 데이터를 직접 분석하면서 R의 활용 능력을 실전 수준으로 끌어올립니다.

파트를 따라가다 보면 자연스럽게 한 가지 흐름이 보입니다. 데이터를 수집하고, 정제하고, 탐색하고, 시각화하고, 마지막으로 보고서로 정리하는 흐름입니다. 데이터 분석가가 실제로 일하는 방식과 동일합니다.

이 파트에서 다루는 내용

  • Ch 01. 공공데이터 포털 활용하기 — data.go.kr 가입부터 데이터 다운로드, 인코딩 처리까지
  • Ch 02. 서울시 교통 데이터 분석 — 지하철 승하차 데이터로 전처리·EDA·시각화 전 사이클 체험
  • Ch 03. 인구 통계 데이터 분석 — 주민등록 인구로 지역별·연령별 분석과 인구 피라미드 시각화
  • Ch 04. EDA 리포트 작성하기 — R Markdown으로 분석 결과를 HTML 리포트로 정리하기