시스템을 평가하거나(PART 11) 실습 데이터가 필요할 때 찾는 대표 데이터셋을 안내합니다. 이 책은 모델 학습이 아니라 활용에 집중했으므로, 데이터셋도 "평가와 실습에 어떻게 쓰는가"의 관점에서 봅니다. 함께 그 한계와 사용 시 주의도 짚습니다.
LFW — 얼굴 인식 평가의 고전
LFW(Labeled Faces in the Wild)는 웹에서 모은 유명인 얼굴 약 1만 3천 장의 데이터셋으로, 얼굴 인식(특히 1:1 확인) 평가의 표준 벤치마크입니다. "같은 사람 쌍"과 "다른 사람 쌍"이 미리 정해져 있어, PART 11의 FAR/FRR 평가에 바로 쓸 수 있습니다.
| 용도 | 방법 |
|---|---|
| 인식 정확도 측정 | 같은쌍·다른쌍의 임베딩 거리로 FAR/FRR(PART 11 Ch01) |
| 임계값 튜닝 출발점 | 거리 분포를 보고 임계값 후보 잡기 |
| 라이브러리 비교 | 같은 쌍으로 여러 모델 정확도 비교(PART 06) |
다만 한계가 있습니다. LFW는 대체로 정면의 깨끗한 유명인 사진이라, 실제 운영 환경(옆얼굴·저조도·일반인)과 다릅니다. LFW에서 99%가 나와도 내 현장에서 그대로 나오지 않습니다. PART 11에서 강조했듯, 최종 평가는 반드시 내 운영 환경과 비슷한 데이터로 해야 합니다.
FER2013 — 표정 인식의 출발점
FER2013은 약 3만 5천 장의 48×48 흑백 얼굴에 7가지 표정 라벨을 붙인 데이터셋으로, 표정 분류 모델의 뿌리입니다(PART 08 Ch01). 이 책이 쓴 DeepFace 감정 모델도 이 계열에서 출발합니다.
FER2013은 표정 인식을 실습·평가할 때 쉽게 구할 수 있는 자료지만, 한계가 뚜렷합니다.
- 저해상도(48×48 흑백)라 미세한 표정 정보가 부족합니다.
- 사람이 붙인 라벨이라 잡음이 많아, 사람조차 정답률이 약 65% 수준입니다.
- 표정 분포가 불균형합니다(행복 많음, 혐오 적음).
그래서 FER2013로 평가한 감정 정확도는 그 자체로 천장이 낮음을 감안해야 합니다. 이는 PART 08 Ch06에서 "감정 인식을 과신하면 안 되는" 이유의 데이터적 근거이기도 합니다.
데이터셋을 쓸 때의 책임
데이터셋은 편하지만, 쓰기 전 확인할 것이 있습니다.
| 확인 | 내용 |
|---|---|
| 라이선스 | 연구용만 허용인지, 상업적 사용 가능한지 |
| 동의·출처 | 얼굴 주체의 동의를 받아 수집됐는지 |
| 편향 | 특정 인종·성별·연령에 치우치지 않았는지(PART 11 Ch07) |
| 목적 | 내 용도에 적합한지(인식용 vs 표정용) |
특히 얼굴 데이터셋 중에는 동의 없이 웹에서 수집되어 논란이 된 것들이 있습니다. 공개됐다고 무조건 써도 되는 것은 아닙니다. 가능하면 동의·라이선스가 명확한 데이터셋을 쓰고, 실제 서비스용 데이터는 PART 11 Ch08의 원칙(명시적 동의·목적 제한)에 따라 직접 수집하는 것이 안전합니다.
실무 팁. 공개 벤치마크 점수에 휘둘리지 마세요. "LFW 99.8%" 같은 숫자는 그 데이터셋에서의 성적일 뿐입니다. 내 시스템의 진짜 정확도는, 내 카메라로 내 사용자를 찍은 데이터로만 알 수 있습니다. 공개 데이터셋은 출발점·비교용으로 쓰고, 배포 전 최종 검증은 반드시 자체 데이터로 하세요.
이 장에서 기억할 것
LFW는 얼굴 인식 1:1 확인 평가의 표준(같은쌍·다른쌍 제공)이고, FER2013은 표정 분류의 출발점(저해상도·라벨잡음 한계)입니다. 둘 다 실습·비교에 유용하지만, 공개 벤치마크 점수가 내 현장 성능을 보장하지 않으므로 최종 평가는 자체 데이터로 합니다. 데이터셋은 라이선스·동의·편향·목적을 확인하고 써야 하며, 공개됐다고 무조건 써도 되는 것은 아닙니다. 이로써 이 책의 모든 내용이 끝났습니다. 얼굴을 다루는 여정에 이 책이 든든한 출발점이 되기를 바랍니다.