VAE

方差是各个样本数据和平均数之差的平方和的平均数。

标准差(Standard Deviation),又称均方差,是方差的平方根

均方误差(Mean Squared Error)是各数据偏离真实值差值的平方和 的平均数,均方误差的开方叫均方根误差,均方根误差才和标准差形式上接近。

方差是数据序列与均值的关系,而均方误差是数据序列与真实值之间的关系

因此,AE的训练损失函数可以采用简单的MSE

训练AE并不需要对数据进行标注,所以AE是一种无监督学习方法

压缩后得到的隐含特征也可以用来做一些其它工作,比如相似性搜索等

主成分分析(PCA)的主要目标是将特征维度变小,同时尽量减少信息损失。简而言之,对于一个样本矩阵:

  • 换特征,找一组新的特征来重新表示;
  • 减少特征,新特征的数目要远小于原特征的数目。

通过PCA将n维原始特征映射到维k(k<n)上,称这k维特征为主成分。需要强调的是,不是简单地从n 维特征中去除其余n- k维特征,而是重新构造出全新的k维正交特征,且新生成的k维数据尽可能多地包含原来n维数据的信息。例如,使用PCA将20个相关的特征转化为5个无关的新特征,并且尽可能保留原始数据集的信息。

生成式对抗网络GAN(Generative Adversarial Nets)

万字综述之生成对抗网络

VAE与GAN的区别:

  1. GAN 的思路比较粗暴,使用一个判别器去度量分布转换模块(即生成器)生成分布与真实数据分布的距离。

  2. VAE 则没有那么直观,VAE 通过约束隐变量 z 服从标准正态分布以及重构数据实现了分布转换映射 X=G(z)。

GAN做异常检测

使用GAN进行异常检测的任务是使用对抗性训练过程建模正常行为,并测量异常评分来检测异常

https://blog.csdn.net/cloudless_sky/article/details/123697481