生成对抗网络GAN原理学习笔记

GAN究竟在做什么？

学习样本集的数据分布

A.学习数据分布有什么用？

（1）学习到高维抽象的分布函数
（2）模拟预测未来数据
（3）处理缺省数据问题：如半监督学习
（4）生产真实样本
建立模型，分析数据特征，还原数据，……

B.如何生成真实样本？

C.生成模型的一些常见方法：

D.生成模型常见方法的比较：

显式：或多或少的需要知道或者假设模型的分布；大多通过Markov chains方法
隐式：使用隐藏编码，无需假设模型，无需Markov chains，以最终生成图像的相似性作为目标

GAN如何做的？

思想：二人零和博弈（two-player game）
博弈双方，两个模型：
生成模型（G），判别模型（D）（分类器/网络结构）
判别模型：是一个二分类器（看作0-1二分类），用于判断样本是真是假；（分类器输入为样本，输出概率大于0.5为真，否则为假）
生成模型：是一个样本生成器，把一个噪声包装成另一个逼真的样本，使得判别器误认为是真样本；（输入为噪声，输出为样本维度相同的噪声（假样本））