无监督异常检测
VAE
方差是各个样本数据和平均数之差的平方和的平均数。
标准差(Standard Deviation),又称均方差,是方差的平方根
均方误差(Mean Squared Error)是各数据偏离真实值差值的平方和 的平均数,均方误差的开方叫均方根误差,均方根误差才和标准差形式上接近。
方差是数据序列与均值的关系,而均方误差是数据序列与真实值之间的关系
因此,AE的训练损失函数可以采用简单的MSE
训练AE并不需要对数据进行标注,所以AE是一种无监督学习方法
压缩后得到的隐含特征也可以用来做一些其它工作,比如相似性搜索等
主成分分析(PCA)的主要目标是将特征维度变小,同时尽量减少信息损失。简而言之,对于一个样本矩阵:
- 换特征,找一组新的特征来重新表示;
- 减少特征,新特征的数目要远小于原特征的数目。
通过PCA将n维原始特征映射到维k(k<n)上,称这k维特征为主成分。需要强调的是,不是简单地从n 维特征中去除其余n- k维特征,而是重新构造出全新的k维正交特征,且新生成的k维数据尽可能多地包含原来n维数据的信息。例如,使用PCA将20个相关的特征转化为5个无关的新特征,并且尽可能保留原始数据集的信息。
生成式对抗网络GAN(Generative Adversarial Nets)
VAE与GAN的区别:
GAN 的思路比较粗暴,使用一个判别器去度量分布转换模块(即生成器)生成分布与真实数据分布的距离。
VAE 则没有那么直观,VAE 通过约束隐变量 z 服从标准正态分布以及重构数据实现了分布转换映射 X=G(z)。
使用GAN进行异常检测的任务是使用对抗性训练过程建模正常行为,并测量异常评分来检测异常
https://blog.csdn.net/cloudless_sky/article/details/123697481
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 吃萝卜不吐萝卜皮~!
评论