iBetter Books
수정

Google Colab 시작하기

딥러닝 모델을 학습시키려면 GPU가 필요합니다. GPU는 수천 개의 코어를 병렬로 실행해 행렬 연산을 빠르게 처리합니다. 일반 CPU로 MNIST를 학습하면 몇 분이 걸리지만, GPU를 사용하면 수십 초면 충분합니다.

Google Colab(이하 코랩)은 구글이 제공하는 클라우드 기반 Jupyter 노트북 환경입니다. 무료로 T4 GPU를 제공하며, 별도 설치 없이 브라우저에서 바로 시작할 수 있습니다.

1.1 코랩 접속 및 노트북 생성

https://colab.research.google.com에 접속합니다. Google 계정으로 로그인한 뒤 새 노트북을 클릭합니다.

1.2 GPU 런타임 설정

코랩은 기본적으로 CPU 모드로 실행됩니다. GPU를 사용하려면 런타임 유형을 변경해야 합니다.

  1. 상단 메뉴 런타임런타임 유형 변경 클릭
  2. 하드웨어 가속기T4 GPU로 변경
  3. 저장 클릭

설정 후 아래 코드로 GPU 연결을 확인합니다.

import torch# GPU 사용 가능 여부 확인device = torch.device("cuda" if torch.cuda.is_available() else "cpu")print(f"사용 중인 장치: {device}")# GPU 정보 출력if torch.cuda.is_available():    print(f"GPU 모델: {torch.cuda.get_device_name(0)}")    print(f"VRAM: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")

코드 1.1 GPU 확인

사용 중인 장치: cuda가 출력되면 GPU가 정상적으로 연결된 것입니다. cpu가 출력되면 런타임 유형 설정을 다시 확인합니다.

1.3 코랩 기본 사용법

코랩 노트북은 단위로 코드를 실행합니다. 셀을 실행하는 방법은 두 가지입니다.

  • Shift + Enter: 셀 실행 후 다음 셀로 이동
  • Ctrl + Enter (macOS: Cmd + Enter): 셀 실행 후 현재 셀 유지

코드 셀과 텍스트 셀을 구분해서 사용합니다. 텍스트 셀은 마크다운 형식으로 메모를 작성할 때 사용합니다.

1.4 패키지 설치

코랩에는 PyTorch, NumPy, Matplotlib 등 주요 패키지가 이미 설치되어 있습니다. 이 교재 전체에서 사용하는 패키지는 다음과 같습니다.

패키지 코랩 기본 설치 역할
torch 딥러닝 프레임워크
torchvision 이미지 처리, 사전학습 모델
matplotlib 시각화
numpy 수치 연산
Pillow 이미지 로드
gradio AI 앱 UI 빌더

Gradio는 별도 설치가 필요합니다. 주제 8에서 처음 사용하므로 그때 설치합니다.

# Gradio 설치 (AI 앱 UI용) — 주제 8에서 사용!pip install gradio -qimport gradio as grprint(f"Gradio 버전: {gr.__version__}")

코드 1.2 추가 패키지 설치

주의: 코랩 세션은 일정 시간 후 자동으로 초기화됩니다. 런타임이 재시작되면 설치한 패키지와 저장하지 않은 파일이 사라집니다. 중요한 코드와 결과물은 Google Drive에 저장하거나 GitHub에 올려두세요.

1.5 Google Drive 연결

코랩 세션이 끊겨도 파일을 유지하려면 Google Drive에 저장합니다.

from google.colab import drive# Google Drive 마운트drive.mount('/content/drive')# Drive 내 폴더 확인import osprint(os.listdir('/content/drive/MyDrive'))

코드 1.3 Google Drive 마운트

코드를 실행하면 구글 계정 인증 팝업이 뜹니다. 허용하면 /content/drive/MyDrive에서 Drive 파일에 접근할 수 있습니다.

1.6 코랩 무료 GPU 할당량 관리

무료 코랩의 GPU 사용 시간은 하루 약 12시간(주당 약 30~50시간)입니다. 할당량을 아끼려면 다음을 실천하세요.

  • 실습이 끝나면 런타임 → 런타임 연결 해제 클릭
  • GPU가 필요 없는 코드(데이터 탐색, 시각화)는 CPU 모드에서 실행
  • GPU 할당량이 부족하면 Kaggle Notebooks를 사용 (다음 절 참조)

1.7 자주 발생하는 오류 해결

코랩에서 자주 만나는 오류와 해결 방법을 정리합니다.

CUDA out of memory (메모리 부족)

RuntimeError: CUDA out of memory. Tried to allocate 512.00 MiB

배치 크기를 줄이거나 불필요한 변수를 해제합니다.

# 해결 1: 배치 크기 줄이기batch_size = 64  # 128 → 64 → 32 순서로 줄여보기# 해결 2: 캐시 비우기import torchtorch.cuda.empty_cache()# 해결 3: 사용 후 변수 삭제del large_tensortorch.cuda.empty_cache()

런타임 재시작 후 변수/파일 사라짐

코랩 세션이 끊기면 설치한 패키지와 /content 파일이 초기화됩니다.

# 해결: 노트북 맨 위에 항상 실행할 셀 모아두기!pip install gradio -qfrom google.colab import drivedrive.mount('/content/drive')

FileNotFoundError: 모델 파일을 찾을 수 없음

FileNotFoundError: [Errno 2] No such file or directory: 'best_model.pth'

파일이 /content에 있는지, Drive를 마운트했는지 확인합니다.

import os# 현재 위치 확인print(os.getcwd())           # /contentprint(os.listdir('/content')) # 파일 목록 확인# Drive에 저장된 경우model_path = '/content/drive/MyDrive/AI_Project/best_model.pth'print(os.path.exists(model_path))  # True이면 파일 존재