PART 06. 텍스트 처리와 정규표현식
리눅스에서 가장 많이 하는 일은 텍스트를 다루는 것입니다. 로그 파일에서 오류만 뽑아내고, CSV 데이터에서 특정 열을 추출하고, 설정 파일에서 주석을 제거하는 일들이 매일 반복됩니다.
이 PART는 두 단계로 나뉩니다. 01장에서는 grep, sort, uniq, cut, tr, wc 같은 텍스트 처리 도구들을 하나씩 익힙니다. 각 도구는 단순하지만, 파이프로 연결하면 강력한 텍스트 분석 파이프라인이 됩니다. 02장에서는 정규표현식을 배웁니다. 정규표현식은 처음엔 낯설어 보이지만, 규칙을 하나씩 이해하면 어떤 패턴도 표현할 수 있습니다.
두 장을 마치면 실무에서 마주치는 로그 분석, 데이터 추출, 패턴 검증 작업을 쉘 한 줄로 처리할 수 있게 됩니다.
학습 목표
- grep으로 텍스트 파일에서 원하는 패턴을 검색할 수 있습니다.
- sort와 uniq를 조합해 데이터 빈도를 분석할 수 있습니다.
- cut과 paste로 필드 단위 데이터를 추출하고 합칠 수 있습니다.
- tr과 wc로 문자 변환과 통계를 처리할 수 있습니다.
- BRE와 ERE의 차이를 이해하고 상황에 맞게 사용할 수 있습니다.
- 자주 쓰는 정규표현식 패턴(이메일, IP, 날짜 등)을 작성할 수 있습니다.
- grep과 정규표현식을 조합한 실전 로그 분석 스크립트를 작성할 수 있습니다.
구성
| 장 | 제목 | 주요 내용 |
|---|---|---|
| 01장 | 텍스트 처리 기초 | grep, sort, uniq, cut, paste, tr, wc |
| 02장 | 정규표현식 | BRE, ERE, 실전 패턴, grep 조합 |