图神经网络中的异质图神经网络(Heterogeneous Graph Neural Networks)原理与应用
字数 1767 2025-11-17 15:20:06
图神经网络中的异质图神经网络(Heterogeneous Graph Neural Networks)原理与应用
1. 异质图基础概念
- 定义:异质图(Heterogeneous Graph)是由多种类型的节点和边构成的图结构,与同质图(所有节点/边类型相同)相对。例如,学术网络中包含作者、论文、会议等节点类型,以及"撰写""发表"等边类型。
- 形式化表示:定义为有向图 \(G = (V, E, \mathcal{T}, \mathcal{R})\),其中:
- \(V\) 是节点集合,\(E\) 是边集合
- \(\mathcal{T}\) 是节点类型集合,\(\mathcal{R}\) 是边类型集合
- 每个节点属于一个类型 \(\phi(v) \in \mathcal{T}\),每条边属于一个关系 \(\psi(e) \in \mathcal{R}\)
- 示例:在电影图中,节点类型包括用户、电影、演员,边类型包括"评分""出演"。
2. 异质图神经网络的特殊挑战
- 类型感知的消息传递:不同关系的语义差异要求消息传递时区分边类型(例如"引用"关系与"合作"关系应分开处理)。
- 节点类型特异性:不同类型节点的特征可能位于不同空间(如用户年龄与电影类型),需分别映射。
- 元路径(Meta-path)的重要性:如"作者-论文-会议-论文-作者"这类多跳路径能捕捉复合语义,需显式建模。
3. 核心架构:分类型消息传递机制
以经典模型RGCN(Relational GCN)为例,其消息传递分三步:
- 步骤1:关系特定的线性变换
对每个关系 \(r \in \mathcal{R}\),定义独立的权重矩阵 \(W_r\):
\[ h_{i}^{(r)} = W_r \cdot h_i \]
其中 \(h_i\) 是节点 \(i\) 的当前特征,\(h_{i}^{(r)}\) 是为关系 \(r\) 变换后的特征。
- 步骤2:关系感知的邻居聚合
对每个目标节点 \(i\),按关系类型分组聚合邻居信息:
\[ m_i^{(r)} = \sum_{j \in \mathcal{N}_i^r} \frac{1}{|\mathcal{N}_i^r|} h_j^{(r)} \]
其中 \(\mathcal{N}_i^r\) 是节点 \(i\) 在关系 \(r\) 下的邻居集合,归一化处理避免邻居数量偏差。
- 步骤3:多关系消息融合
将所有关系类型的消息与自连接信息相加,并通过激活函数:
\[ h_i' = \sigma \left( \sum_{r \in \mathcal{R}} m_i^{(r)} + W_0 \cdot h_i \right) \]
这里 \(W_0\) 处理自循环,确保节点自身信息不丢失。
4. 进阶技术:元路径引导的建模
- 元路径定义:形如 \(A \xrightarrow{R_1} B \xrightarrow{R_2} C\) 的路径,如"用户-评分-电影-导演-导演"。
- 应用方式:
- 显式元路径实例化:先提取图中所有元路径实例,将其视为同质图,再分别应用GNN。
- 隐式元路径学习:通过多层GNN自动捕获多跳语义(如HAN模型),使用注意力机制加权不同元路径的重要性。
5. 实际应用中的优化策略
- 参数共享:对出现频率低的关系,可共享部分权重矩阵参数以防止过拟合。
- 边方向处理:对双向关系(如合著),可拆分为两个单向关系或使用特殊参数化。
- 异构特征对齐:对不同类型节点的原始特征,先通过类型特定的映射层投影到同一空间。
6. 典型应用场景
- 推荐系统:用户-商品异质图中,利用元路径(如"用户-商品-类别-商品")增强表示。
- 学术网络分析:预测论文主题时,融合"作者-机构""论文-关键词"等多关系信息。
- 生物医学:药物-蛋白-疾病异质图中推断药物副作用。
总结:异质图神经网络通过关系特定的消息传递、元路径建模等技术,解决了多类型节点/边带来的语义复杂性,成为处理现实世界复杂关系数据的重要工具。其核心思想是"分而治之":按类型差异化处理,再融合全局信息。