๐Paper Review
[paper review] Generative Adversarial Nets
AbstractImage data์ ๋ํ ํ๋ฅ ๋ถํฌGenrative Models1. Introduction2. Adversarial NetsGAN์ ์๋ ด ๊ณผ์ Global Optimalityํ๋ณ๊ธฐ์ global optimum point์์ฑ๊ธฐ์ global optimum pointKL divergence(์ฟจ๋ฐฑ-๋ผ์ด๋ธ๋ฌ ๋ฐ์ฐ)Jensen-Shannon DivergenceGAN ์๊ณ ๋ฆฌ์ฆ
- ์ง์ง์ ๋์ผํด ๋ณด์ด๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋ model
- ๊ธฐ์กด ์ง๋ํ์ต์ ํ๊ณ๋ฅผ ๋ฐ์ด๋์ model
- ๊ธฐ์กด์ ์ง๋ํ์ต์ ๊ฒฝ์ฐ dataset์ด ํ์. ์ด๋ฌํ dataset์ ๋ง๋๋ ๊ณผ์ ์ ๋ง์ ๋น์ฉ ๋ฐ์
- GAN์ ๋น์ง๋ํ์ต์ ์ํ๋ฉฐ, data๋ฅผ ์ง์ ์์ฑํ๋ ํฐ ์ฅ์ ์ ๊ฐ์ง
Abstract
- ๋ ๊ฐ์ ๋ถ๋ฆฌ๋ ๋ชจ๋ธ
- Generative model(์์ฑ๊ธฐ,G) : data์ ๋ถํฌ๋ฅผ ํฌ์ฐฉ
- Discriminative model(ํ๋ณ๊ธฐ,D) : ํ sample์ด ์์ฑ๊ธฐ๊ฐ ์๋ ์ค์ training data๋ก๋ถํฐ ์์ ๊ฒ์ด๋ผ๋ ํ๋ฅ ์ ์ถ์ ํ๋ model
- ์๋ฅผ ๋์์ ํ์ตํ๋ adversarial process ๊ณผ์
- G์ ํ์ต์ ์ฐจ๋ D๊ฐ ์๋ชป๋ ๊ฒฐ์ ์ ํ๊ฒ ๋ง๋ค ํ๋ฅ ์ ์ต๋ํํ๋ ๊ฒ
Image data์ ๋ํ ํ๋ฅ ๋ถํฌ
- Image data๋ ๋ค์ฐจ์ ํน์ง ๊ณต๊ฐ์ ํ ์ ์ผ๋ก ํํ. Image ๋ถํฌ๋ฅผ ๊ทผ์ฌํ๋ model์ ํ์ตํ ์ ์์
- ex) ์ฌ๋์ ์ผ๊ตด์๋ ํต๊ณ์ ์ธ ํ๊ท ์น๊ฐ ์กด์ฌ -> model์ ์ด๋ฅผ ์์น์ ์ผ๋ก ํํ
- Image์์๋ ๋ค์ํ ํน์ง๋ค์ด ๊ฐ๊ฐ์ ํ๋ฅ ๋ณ์๊ฐ ๋๋ ๋ถํฌ. ๋ค๋ณ์ ํ๋ฅ ๋ถํฌ(Multivariate probability distribution)
Genrative Models
- ์ค์กดํ์ง ์์ง๋ง ์์ ๋ฒํ data๋ฅผ ์์ฑํ ์ ์๋ model
- ์ฌ๋ฌ ๊ฐ์ ๋ณ์์ ๋ํ ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ์ ํต๊ณ์ ๋ชจํ
1. Introduction
- ์ ๋์ ์ ๊ฒฝ๋ง(adversarial nets) : G๊ฐ D๋ฅผ ์์ด๋๋ก ํ๊ณ , D๋ ์ด๋ค sample์ด G๊ฐ modelingํ ๋ถํฌ๋ก๋ถํฐ ๋์จ ๊ฒ์ธ์ง ์ค์ data ๋ถํฌ๋ก๋ถํฐ ๋์จ๊ฒ์ธ์ง๋ฅผ ๊ฒฐ์ ํ๋ ๋ฒ์ ํ์ต. ์ด์ ๊ฐ์ ๊ฒฝ์๊ตฌ๋๋ ๋ model์ด ๋ชจ๋ ๊ฐ๊ฐ์ ๋ชฉ์ ์ ๋ฌ์ฑ์ํค๊ธฐ ์ํด ์ค์ค๋ก๋ฅผ ๊ฐ์ ํ๋๋ก ํจ
- (G๋ D๋ฅผ ๋ ์ ์์ด๋๋ก ์๋ณธ data๋ฅผ ๋ ์ ๋ชจ๋ฐฉํ ๋ถํฌ๋ฅผ ํ์ต, D๋ ์ง์ง/๊ฐ์ง data๋ฅผ ๋ ์ ๊ฐํํ๋๋ก data์ ํน์ง์ ๋ ์ ํ์ ํ๋๋ก ํ์ต)
- ์ค์ data ๋ถํฌ์ model์ด ์์ฑํ data์ ๋ถํฌ ๊ฐ์ ์ฐจ์ด๋ฅผ ์ค์ด๋ ๊ฒ
- G์ random noise๋ฅผ ๋ํจ์ผ๋ก์จ data๋ฅผ ์์ฑํ๋ฉฐ ์ด๋ฅผ ํ๋ณํ๊ธฐ ์ํด MLP model ์ฌ์ฉ = adversarial nets
- Generator Network : random noise vector๋ฅผ ์ ๋ ฅ๋ฐ์ image๋ฅผ ๋ง๋๋ upsampling ์งํ
- Discriminator Network : Network์ ์ ๋ฌ๋ image๊ฐ ์ค์ ์ธ์ง ๊ฐ์ง์ธ์ง๋ฅผ ํ๋ณ
2. Adversarial Nets
- x : sample image์ data,ย ย : image data๋ค์ ํ๋ฅ ๋ถํฌ, z : generator์ ์ ๋ ฅ๋๋ noise ์์ญ,ย ย : noise์ ํ๋ฅ ๋ถํฌ, G(z) : new data instance, D(x) : training data๋ก๋ถํฐ ๋์๋์ง์ ๋ํ ํ๋ฅ (์ง์ง : 1, ๊ฐ์ง : 0)
pdata(x)
pz(z)
- Generator์ ๋ชฉํ : Discriminator๊ฐ ๊ตฌ๋ถํ์ง ๋ชปํ ์ ๋๋ก ์ค์ data์ ์ ์ฌํ data๋ฅผ ๋ง๋๋ ๊ฒ
- Discriminator์ ๋ชฉํ : Generator๊ฐ ๋ง๋ ๊ฒ๊ณผ ์ค์ data๋ฅผ ์ ๊ตฌ๋ถํด ๋ด๋ ๊ฒ
- ์ด๋ก์ ๋ถํฌ : generative model์ ๋ถํฌ, ๊ฒ์ ์ ๋ถํฌ : ์๋ณธ data์ ๋ถํฌ, ํ๋์ ๋ถํฌ : discriminator์ ๋ถํฌ
- ์๊ฐ์ด ์ง๋๋ฉด์ generative model G๊ฐ ์๋ณธ data์ ๋ถํฌ๋ฅผ ํ์ต
- ํ์ต์ด ์ ๋์๋ค๋ฉด ํต๊ณ์ ์ผ๋ก ํ๊ท ์ ์ธ ํน์ง์ ๊ฐ์ง๋ data๋ฅผ ์ฝ๊ฒ ์์ฑ ๊ฐ๋ฅ
GAN์ ์๋ ด ๊ณผ์
- ์์ฑ์์ ๋ถํฌ๊ฐ ์๋ณธ data์ ๋ถํฌ์ ์๋ ดํ๋๋ก ๋ง๋๋ ๊ฒ.ย ย ->ย , D(G(z))->1/2(ํ์ต์ด ๋ค ์ด๋ฃจ์ด์ง ํ์๋ ์ง์ง์ ๊ฐ์ง๋ฅผ ๊ตฌ๋ณํ ์ ์๊ธฐ ๋๋ฌธ์ 50% ํ๋ฅ ๊ฐ์ ๊ฐ์ง๊ฒ ๋จ = ํ๋ณ์๊ฐ ๋ ์ด์ ๊ตฌ๋ณ์ ๋ชปํจ
Pg
Pdata
Global Optimality
ํ๋ณ๊ธฐ์ global optimum point
- G๊ฐ ๊ณ ์ ๋์ด ์์ ๋
์์ฑ๊ธฐ์ global optimum point
- Global optimum point is
pg=pdata
KL divergence(์ฟจ๋ฐฑ-๋ผ์ด๋ธ๋ฌ ๋ฐ์ฐ)
- ๋ ํ๋ฅ ๋ถํฌ์ ์ฐจ์ด๋ฅผ ๋ณด์ฌ์ฃผ๋ ์
Jensen-Shannon Divergence
- KL divergence์์ ๋์จ ๊ฐ๋ ์ distance metrics๋ก ์ฌ์ฉํ๊ธฐ ์ํ ๋ณํ์
- ๋ ๋ถํฌ๊ฐ ๋์ผํ ๋๋ JSD ๊ฐ์ 0
- ์์ ์ฆ๋ช ๋ค์ model ํ์ต์ด ์ ๋์์ ๋ ์์ ๊ฐ์ ๊ฐ์ ๊ฐ์ ธ์ผํ๋ค๋ ๊ฒ์ ์๋ฏธ.
- ํ์ต์ด ์๋ ดํ๋ ๋ฐฉ๋ฒ์ ๊ดํ ์ X
- ์ญ์ ํ ์ํ
GAN ์๊ณ ๋ฆฌ์ฆ
- ํ๋ณ๊ธฐ ํ์ต ํ -> ์์ฑ๊ธฐ ํ์ต
- ์์ฑ๊ธฐ ํ์ต ํ -> ํ๋ณ๊ธฐ ํ์ต
ย