본문 바로가기

ML/ML Basic

[ML] 학습의 종류

왜 다양한 학습 방식이 존재할까?

  • 머신러닝 모델은 "데이터"를 통해 학습합니다. 그런데 데이터가 항상 ‘완벽하게 준비’된 건 아닙니다.
  • 따라서 머신러닝은 데이터 구성과 학습 목적에 따라 다양한 방식으로 발전해왔습니다.

지도 학습 (Supervised Learning)

  • 정의: 입력과 그에 대응되는 정답(라벨)이 있는 데이터를 사용
  • 목적: 입력을 기반으로 정확한 출력을 예측
  • 예시:
    • 이메일 → 스팸/비스팸 분류
    • 고양이/강아지 이미지 분류
  • 대표 알고리즘: Logistic Regression, SVM, CNN, BERT (Fine-tuning 시)

비지도 학습 (Unsupervised Learning)

  • 정의: 정답(라벨) 없이 입력 데이터만 가지고 패턴이나 구조를 학습
  • 목적: 데이터 군집화, 차원 축소, 이상 탐지 등
  • 예시:
    • 뉴스 기사 클러스터링
    • 고객 세그멘테이션
  • 대표 알고리즘: K-means, PCA, Autoencoder

자기 지도 학습 (Self-Supervised Learning)

  • 정의: 입력의 일부를 숨기고, 나머지로 그걸 예측하도록 스스로 학습
  • 목적: 라벨 없이도 특징 표현(Representation)을 잘 학습
  • 예시:
    • BERT: 문장에서 일부 단어를 가리고 맞히기
    • SimCLR: 이미지 두 버전이 같은 물체임을 학습
    • 예를 들어, 대량의 이미지를 자기 지도 학습으로 사전 학습(Pre-Training)시킴으로써, 이미지 자체의 이해도를 높일 수 있음
      • 이후 전이 학습(Transfer Training)을 통해 학습 데이터가 적더라도 좋은 성능을 낼 수 있기 때문에, 학습 데이터가 적은 경우 효과적일 수 있음
  • 강점:
    • 라벨이 없어도 대규모 데이터에서 학습 가능
    • 전이학습 성능 우수

강화 학습 (Reinforcement Learning)

  • 정의: 행동 → 보상(Reward) → 개선 과정을 통해 학습
  • 목적: 보상을 최대화하는 행동을 스스로 탐색
  • 예시:
    • 알파고
    • 로봇 제어
  • 핵심 개념: 에이전트, 상태, 행동, 보상, 환경
  • 단점: 학습 비용 큼, 안정적인 결과 얻기 어려움

 

실제 학습에는 하나의 방법만이 사용되는 경우도 있지만, 여러 학습 방법이 복합적으로 적용될 수 있다.

'ML > ML Basic' 카테고리의 다른 글

[ML] CNN vs RNN vs GAN  (1) 2025.06.22
[ML] AI vs ML vs DL  (2) 2025.06.22