CARE-GNN
Enhancing
Graph Neural Network-based Fraud Detectors against Camouflaged
Fraudsters
Yingtong Dou1, Zhiwei Liu1, Li Sun2, Yutong Deng2, Hao Peng3, Philip
S. Yu1
会议:CIKM '20
原文地址:https://dl.acm.org/doi/abs/10.1145/3340531.3411903
参考翻译:https://blog.csdn.net/jingcao233/article/details/121718108
introduction
Graph-based methods can reveal the suspiciousness of these entities
at the graph level, since fraudsters with the same goal tend to connect
with each otherTextual features
GNN-based methods ag ...
建站备忘录
防止记性不好忘记了或者换电脑找不到啦~~
网站
mac上安装hexo:https://blog.csdn.net/2301_77285173/article/details/130184563
另:先安装homebrew在用brew install
wget,然后安装nvm(homebrew国内安装方法:https://zhuanlan.zhihu.com/p/111014448/)
图标库:https://fontawesome.com/icons
hexo命令
新建一篇文章:hexo new post "article title"
新建页面:hexo new page "page name"
Hexo 默认的静态 url
格式是::year/:month/:day/:title,是按照年、月、日、文章标题来生成固定链接的。如:http://id.github.io/2022/11/23/hello-world。
使用 Abbrlink
插件可以使每篇文章都有一个唯一的编号,并将文章的链接用这个编号唯一区别,这样链接中不会出现中文,也不会因为修改文章的日期而导致链接的改变。
使用g ...
CDSI
. Unlike existing score-based diffusion models, the reverse process
can take observations (on the top left of
the fifigure) as a conditional input, allowing the model to exploit
information in the observations for
denoising. We utilize an attention mechanism to capture the temporal
and feature dependencies of
time series
本文利用一种注意机制来捕捉时间序列的时间依赖性和特征依赖性
在实践中,我们并不知道ground truth missing value(i.e., imputation
targets),或训练数据可能根本不包含缺失值。然后,受masked language
modeling的启发,本文开发了一种自监督(self-supervised)的训练方法,将观 ...
扩散模型——分子图生成
综述-Generative
Diffusion Models on Graphs: Methods and Applications
主要应用在molecule and protein modeling
现有方法分为两类:
自回归生成(autoregressive
generation):按照决策序列的顺序一步一步地生成期望的图(具有拓扑结构和整个图节点/边缘特征)。
单样本生成(one-shot
generation):在一个步骤中生成具有拓扑结构和节点/边特征的完整的图
分子图生成面临的挑战:
Discreteness(离散性):图结构是离散的,导致模型的梯度计算困难。因此不能将广泛使用的优化算法直接以端到端的方式引入到图生成的反向传播训练中。
Complex Intrinsic
Dependencies(复杂的内在依赖):与图像数据不同,节点不是独立同分布(i.i.d.)的,这种图结构的复杂性为生成所需的图带来了巨大的挑战。
Permutation
Invariant(置换不变性):由于节点在大多数图中自然是无序的,所以最多有N!个不同的等效邻接矩阵代表具有N个节点的 ...
图神经网络
综述:A Comprehensive Survey on Graph Neural Networks
https://cloud.tencent.com/developer/article/1902489
https://www.zhihu.com/question/54504471/answer/332657604
https://zhuanlan.zhihu.com/p/538914712
https://blog.csdn.net/qq_44689178/article/details/123396737
Graph Transformers
一些关于transformer
cls:classification,用于下游的分类任务。CLS就是一个向量,只是不是某一个字的向量,是一个够代表整个文本的的语义特征向量,取出来就可以直接用于分类了。实际场景:问答(判断一个问题与一个答案是否匹配)、语句匹配(两句话是否表达同一个意思)等
BERT模型除了添加[CLS]符号并将对应的输出作为文本的语义表示,还对输入的两句话用一个[SEP]符号作分割,并分别对两句话附加两个不同的文本向量以作区分,如下图所示。
RNN的两个明显问题:
效率问题:需要逐个词进行处理,后一个词要等到前一个词的隐状态输出以后才能开始处理
如果传递距离过长还会有梯度消失、梯度爆炸和遗忘问题
LSTM、GRU的改进属于换汤不换药。
为解决这些问题,设计的Transformer是一个N进N出的结构,每个Transformer单元相当于一层的RNN层,接收一整个句子所有词作为输入,然后为句子中的每个词都做出一个输出。但是与RNN不同的是,Transformer能够同时处理句子中的所有词,并且任意两个词之间的操作距离都是1,很好地解决了上面提到的RNN的效率问题和距 ...
动态图异常检测——HOG-GCN
这篇文章是2022一篇综述里的,看之前没有意识到是前几年在spatial
domain的研究,但是看了还是写下来了。
Powerful
Graph Convolutional Networks with Adaptive Propagation Mechanism for
Homophily and Heterophily(HOG-GCN)
Motivation:let the propagation mechanism of GCN essentially suitable
for both homophily and
heterophily,根据节点对之间的同质性进行聚合。首先从attribute和topology
space中学习homophily degree
matrix,并进一步用它在邻域之间进行特征传播;在传播过程可以通过下游半监督任务帮助学习更好的homophily
degree matrix
Homophily Degree Matrix
Estimation
attribute space:graph-agnostic MLP
其中,\(B_{ic}\)表示表示 ...
动态图异常检测数据集,及GearSage代码详解
传统意义的时序异常检测
随着车辆、工业系统和数据中心等网络物理系统(CPS)中的互联设备和传感器的快速增长,监测这些设备的需求越来越大以保护他们免受攻击。对于电网、水处理厂、交通和通信网络等关键基础设施尤其如此。
许多这样的现实世界系统涉及到大量的相互连接的传感器,这些传感器可以产生大量的时间序列数据。例如,在一个水处理厂中,可以有许多传感器测量其各部件中的水位、流量、水质、阀门状态等。来自这些传感器的数据可以以复杂的、非线性的方式联系起来:例如,一个阀门导致压力和流量的变化,导致进一步的变化,因为自动机制响应变化的变化。随着这种传感器数据的复杂性和维度的增长,人类手动监控这些数据的能力越来越低。
研究时序变化的图结构的异常检测
Dataset
#Node
#Edge
Edge Type
Max. Degree
Avg. Degree
#Timestamp
Paper
UCI Message1
1899
13838
directed、unweighted、inject
anomalies
255
14.57
190
AddGraph、DynAD、Hie ...
扩散模型
一系列噪声扰动图中的边缘(也就是前向扩散过程),并通过学习将这个过程从噪声转换到数据来生成图(a.k.a,生成扩散过程)。由于排列不变性约束和同时考虑离散局部运动的必要性,有效地采用现有的方法来绘制数据是非常重要的Fs和图的整体拓扑性质。
这个github仓库整理了关于扩散模型的资源和论文集:https://github.com/heejkoo/Awesome-Diffusion-Models
这个是扩散模型综述的中文翻译:https://www.yuque.com/jinyuma-igdk2/hcuntc/hhlwis
扩散模型在图领域目前的应用还比较少
这篇文章通俗地解释了各个生成模型之间的关系https://zhuanlan.zhihu.com/p/591881660
想象平面上方的一个曲面,该曲面的高度对应于簇的密度。这个曲面映射出一个概率分布。使用这个概率分布来生成新的图像。所需要做的就是随机生成新的数据点,同时遵守更频繁地生成更可能的数据的限制——这一过程被称为“采样”分布。每个新的点都是一个新的图像。这一过程的挑战是学习构成训练数据的一些图像集的复杂概率分布。比如每张照片 ...