[논문 리뷰] GPEN : GAN Prior Embedded Network for Blind Face Restoration in the Wild

GitHub - yangxy/GPEN

Contribute to yangxy/GPEN development by creating an account on GitHub.

github.com

논문 링크 : https://arxiv.org/pdf/2105.06070

1. Introduction

Blind Face Restoration (BFR) Task를 다룸

실제 환경에선 열화가 다양하기 때문에 BFR Task는 매우 어려운 문제임
GAN의 발전 이후 극도로 낮은 해상도의 입력을 재구성하려는 시도가 생김
- 사전 학습된 GAN을 변경하지 않아 복원 품질이 불안정한 문제 발생

본 논문은 GAN과 DNN의 장점을 통합함
GAN을 사전 학습한 뒤, 얼굴 복원을 위한 디코더 사전(prior)으로 DNN에 삽입함
합성된 저화질-고화질 얼굴 이미지 쌍으로 GAN 사전이 삽입된 DNN을 fine-tuning 함

U자형 DNN 구조

전역적 얼굴 구조는 깊은 특성 복원을 위한 잠재 코드로, 국소적인 얼굴 세부 정보는 얕은 특성을 복원하기 위한 노이즈로 사용됨

2. Related Work

[Face Image Restoration]
잡음 제거, 디블러링, 인페인팅, 이미지 초해상도와 같은 이미지 복원 과제에서 DNN의 성공적임
- 많은 DNN기반 얼굴 이미지 복원 방법이 제안

Wavelet-based approach

[GAN]
조건부 GAN(cGAN) 제안

생성기에 서로 다른 조건 정보를 제공 -> 이미지 투 이미지 변환 문제 성공적 처리
다양한 시나리오로 cGAN을 확장

cGAN : 입력 도메인에서 출력 도메인으로 직접 매핑 학습
ill-posed 과제에선 결과가 과도하게 매끈해지는 문제 발생

[GAN Prior for Image Generation]
GAN 모델을 사용해 주어진 이미지를 다시 latent code로 되돌리는 GAN inversion 작업이 개발
이미지를 StyleGAN의 확장된 잠재 공간에 임베딩 - 추가적인 의미론적 이미지 편집 가능

느리고 실제 응용에 적합 X
-> Pixel2Style2Pixel은 추가 최적화 없이 실제 이미지를 확장된 잠재 공간에 임베딩, 폭넓은 이미지-투-이미지 변환 과제에 사용 가능

GAN inversion은 이미지 공간을 잠재 공간으로 완벽하게 투영하는 것이 어려움

-> Gan Prior을 전이(transfer)하는 방식을 제안
GAN을 통한 이미지 생성에 도메인 적응을 적용 등 전이학습의 다양한 접근법이 소개됨

다른 연구 : 본 소스 도메인에서 획득한 지식을 서로 다른 타깃 도메인으로 전이하는 것을 목표
본 연구 : 소스와 타깃 도메인이 동일함

GAN Prior을 얼굴 복원을 위한 DNN에 임베딩 -> 서로 다른 네트워크 계층에서 적절한 잠재 코드와 노이즈 입력이 생성되도록 GAN Prior network와 DNN을 공동으로 fine-tuning함

3 Proposed Method

3.1 Motivation and Framework

열화된 얼굴 공간 X, 원래 HQ 얼굴 이미지 공간 Y
대부분 DNN 기반 방법은 mapping function을 학습함, 픽셀 단위 손실 함수 사용

x가 생성된 hq 얼굴들의 평균이 되어 세부 정보를 잃는 문제 발생

GAN Prior network를 학습
GPEN 의 첫번째 부분은 CNN 인코더 -> 입력 DG 이미지 x를 원하는 latent code z로 매핑하는 법을 학습
G(z) -> Y를 통해 원하는 hq 얼굴 이미지 재생성 / 일대일 매핑

기존 방법들은 사전 학습된 GAN을 변경하지 않음

3.2 Network Architecture

[Mapping Network]
Affine Transformation 이유 : Mapping network의 결과 w는 1xC의 shape를 가지고 있어서 style을 입힐 때 shape가 안 맞음. 아핀 변환을 통해 shape를 맞춰줌

[발표 PPT]

저작자표시 비영리 변경금지 (새창열림)

'AI > 논문 리뷰' 카테고리의 다른 글

[논문리뷰] Video Depth Anything : Consistent DepthEestimation for Super-Long Videos (0)	2025.10.20
[논문리뷰] CodeFormer : Towards Robust Blind Face Restoration with Codebook Lookup Transformer (0)	2025.01.20
[논문리뷰] SPARNet : Learning Spatial Attention for Face Super-Resolution (0)	2024.05.27
[논문리뷰] Learning Attention from Attention: Efficient Self-Refinement Transformer for Face Super-Resolution (0)	2023.12.26
[논문 공부] RPF: Reference-Based Progressive FaceSuper-Resolution Without LosingDetails and Identity (2)	2023.11.22

민도리의 공부

[논문 리뷰] GPEN : GAN Prior Embedded Network for Blind Face Restoration in the Wild

1. Introduction

2. Related Work

3 Proposed Method

'AI > 논문 리뷰' 카테고리의 다른 글

티스토리툴바

[논문 리뷰] GPEN : GAN Prior Embedded Network for Blind Face Restoration in the Wild

1. Introduction

2. Related Work

3 Proposed Method

'AI > 논문 리뷰' 카테고리의 다른 글

관련글

티스토리툴바