ICCV 2017
CycleGAN、DualGAN、DiscoGAN孪生三兄弟
motivation
- cGAN用于cross-domain的image-to-image translation(需要pairs)
- dual learning from natural language translation (同时训练两个相反的语言翻译器French-to-English和English-to-French)
contribution
- 在2个domain上的两个unlabel图像集上训练。general-purpose:不需要domain-specific的信息和pre-trained domain表征。
- 与在全标注的书记上训练的cGAN有comparable results
related work
CycleGAN
CoGAN(Coupled generative adversarial networks):也是不需要paired数据训练两个GAN,但这两个GAN没有cycle consistency约束。learns a joint distribution over images from two domains. 对2个G和2个D在高层语义上共享权重。但这样就使该方法不能得到general-purpose的方案。
method
segmentation,stylization,abstraction都可以视为image-to-image translation的任务。用FCNs而不是LSTM或者GRU。
primal task:$G_A: U\rightarrow V$
dual task: $G_B: V \rightarrow U$
上面的$z$是随机噪声。
用了WGAN提升训练的稳定性。
(感觉好像cycleGAN,除了这个WGAN),作者是这么说的:
training details
依照WGAN的训练,先把判别器训练$n_{critic}$次,再训练一次生成器。用RMSProp(基于动量的adam优化器会导致训练不稳定)