[ML] CNN vs RNN vs GAN

주요 용도: 이미지 인식, 객체 탐지, 영상 처리
핵심 아이디어: 이미지의 공간적 특성을 보존하면서 특징 추출
구조 특징:
- 컨벌루션 계층: 입력 영상을 일련의 컨벌루션 필터에 통과시킵니다. 각 필터는 영상에서 특정 특징을 활성화합니다.
- ReLU(Rectified Linear Unit) 계층: 음수 값은 0에 매핑하고 양수 값은 그대로 두어서 더 빠르고 효과적인 훈련이 이루어지도록 합니다. 이때 활성화된 특징만 다음 계층으로 전달되므로 이를활성화라고도 합니다.
- 풀링 계층: 비선형 다운샘플링을 수행하여 신경망이 학습해야 하는 파라미터의 개수를 줄임으로써 출력을 단순화합니다.
- 이러한 연산이 수십 또는 수백 개의 계층에 대해 반복되며, 각 계층은 서로 다른 특징을 식별하도록 학습합니다.
장점:
- 파라미터 효율적 (필터 공유)
- 이미지에 강한 성능
단점:
- 시간 정보를 처리하기에는 부적합
예시:
- YOLO, VGGNet, ResNet

주요 용도: 이미지 생성, 데이터 증강, 딥페이크, 스타일 전이
핵심 아이디어: 두 개의 네트워크(Generator vs Discriminator)가 서로 경쟁하며 성능 향상
구조 특징:
- Generator: 진짜 같은 가짜 데이터를 생성
- Discriminator: 진짜와 가짜를 구별
- D를 먼저 학습 -> G가 생성한 자료를 D가 진짜인지 가짜인지 헷갈릴 정도로 학습 -> D를 다시 학습 -> 반복...
- 즉, 실제 같은 데이터를 생성하기 위해 두 네트워크가 경쟁하는 생성적 적대 신경망
장점:
- 고품질의 데이터를 생성 가능
단점:
- 학습이 불안정함 (모델 균형 맞추기 어려움)
- Mode collapse 등의 문제
예시:
- 딥페이크 등

[ML] 학습의 종류 (0)	2025.06.22
[ML] AI vs ML vs DL (2)	2025.06.22

echo "Hello World"