데이터의 본질적인 특성을 좌표로 표현한 숨겨진 공간
Latent space(잠재공간) 는 복잡하고 고차원적인 원본 데이터를 더 단순하면서도 의미 있는 형태로 압축하여 표현한 공간입니다.
이미지, 음성, 텍스트와 같은 데이터는 차원이 매우 높아 그대로 처리하기 어렵습니다. 딥러닝 모델은 이러한 데이터를 내부적으로 보이지 않는 공간(latent space) 으로 변환하여 핵심적인 특징만을 학습합니다.
Latent Space가 필요한 이유
1. 고차원 데이터의 효율적 표현
이미지 데이터를 예로 들면, 256×256×3 크기의 이미지는 약 20만 차원의 정보를 가집니다.
이를 그대로 학습하는 것은 비효율적입니다. 때문에 Latent space에서는 이 정보를 16차원, 32차원과 같은 저차원 벡터로 압축하여 표현합니다.
이를 통해 연산량이 줄어들고 모델 학습이 안정됩니다.
2. 의미 있는 특징의 구조화
Latent space에서는 단순한 픽셀 값이 아닌 의미 중심의 특징이 정리됩니다.
- 서로 비슷한 데이터는 가까운 위치에 배치
- 성질이 다른 데이터는 멀리 떨어져 위치
즉, 데이터 간의 관계가 공간적 거리로 표현됩니다.
3. 생성 모델의 핵심 개념
VAE, GAN, Diffusion 모델과 같은 생성 모델에서는 Latent space가 새로운 데이터를 만들어내는 출발점이 됩니다.
- Latent space의 한 점 → 하나의 데이터 샘플
- 공간을 이동하거나 보간(interpolation) → 새로운 데이터 생성
이로 인해 이미지 생성, 스타일 변환, 데이터 증강 등이 가능해집니다.
Latent Space의 직관적인 예시
Latent space를 지도(map) 로 비유할 수 있습니다.
- 각 점은 하나의 데이터입니다.
- 가까운 점들은 서로 유사한 특성을 가집니다.
- 특정 방향으로 이동하면 데이터의 성질이 점진적으로 변화합니다.
예를 들어 얼굴 이미지의 latent space에서는 한 방향은 나이, 다른 방향은 표정이나 각도를 의미할 수 있습니다.
Latent Space는 어디에서 만들어질까?
Latent space는 주로 인코더(Encoder) 에 의해 생성됩니다.
- AutoEncoder
- Variational AutoEncoder(VAE)
- Flow-based model
- Diffusion model의 중간 표현
이러한 모델들은 입력 데이터를 latent space로 변환한 뒤, 필요에 따라 다시 원본 공간으로 복원합니다.
정리
- Latent space는 데이터의 핵심 정보만 담은 저차원 공간
- 복잡한 데이터를 효율적으로 다루기 위해 사용
- 데이터 간의 유사성과 구조를 공간적으로 표현
- 생성 모델과 표현 학습의 핵심 개념
Latent space를 이해하면, 딥러닝 모델이 데이터를 ‘어떻게 이해하고 상상하는지’를 이해할 수 있습니다.
'Computer Science > 딥러닝' 카테고리의 다른 글
| 다중공선성이란? (0) | 2026.02.05 |
|---|---|
| 파운데이션 모델(Foundation Model)이란? (0) | 2026.01.31 |
| 딥러닝에서 파라미터(Parameter)와 하이퍼파라미터(Hyperparameter)의 차이 (0) | 2026.01.19 |
| Flow Matching이란? (0) | 2026.01.17 |
| Colab GPU 비교: T4 · A100 · H100 (0) | 2026.01.16 |