iBetter Books
수정

PART 06. 텍스트 처리와 정규표현식

리눅스에서 가장 많이 하는 일은 텍스트를 다루는 것입니다. 로그 파일에서 오류만 뽑아내고, CSV 데이터에서 특정 열을 추출하고, 설정 파일에서 주석을 제거하는 일들이 매일 반복됩니다.

이 PART는 두 단계로 나뉩니다. 01장에서는 grep, sort, uniq, cut, tr, wc 같은 텍스트 처리 도구들을 하나씩 익힙니다. 각 도구는 단순하지만, 파이프로 연결하면 강력한 텍스트 분석 파이프라인이 됩니다. 02장에서는 정규표현식을 배웁니다. 정규표현식은 처음엔 낯설어 보이지만, 규칙을 하나씩 이해하면 어떤 패턴도 표현할 수 있습니다.

두 장을 마치면 실무에서 마주치는 로그 분석, 데이터 추출, 패턴 검증 작업을 쉘 한 줄로 처리할 수 있게 됩니다.

학습 목표

  • grep으로 텍스트 파일에서 원하는 패턴을 검색할 수 있습니다.
  • sort와 uniq를 조합해 데이터 빈도를 분석할 수 있습니다.
  • cut과 paste로 필드 단위 데이터를 추출하고 합칠 수 있습니다.
  • tr과 wc로 문자 변환과 통계를 처리할 수 있습니다.
  • BRE와 ERE의 차이를 이해하고 상황에 맞게 사용할 수 있습니다.
  • 자주 쓰는 정규표현식 패턴(이메일, IP, 날짜 등)을 작성할 수 있습니다.
  • grep과 정규표현식을 조합한 실전 로그 분석 스크립트를 작성할 수 있습니다.

구성

제목 주요 내용
01장 텍스트 처리 기초 grep, sort, uniq, cut, paste, tr, wc
02장 정규표현식 BRE, ERE, 실전 패턴, grep 조합