(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221087141 1.2
(22)申请日 2022.07.22
(71)申请人 浙江大学
地址 310058 浙江省杭州市西湖区余杭塘
路866号
(72)发明人 况琨 陈政聿 吴飞
(74)专利代理 机构 杭州求是专利事务所有限公
司 33200
专利代理师 傅朝栋 张法高
(51)Int.Cl.
G06Q 50/00(2012.01)
G06F 16/901(2019.01)
G06V 10/774(2022.01)
G06V 10/762(2022.01)
G06V 10/764(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
面向社交网络分布外泛化的图神经网络预
测方法及系统
(57)摘要
本发明公开了一种面向社交网络分布外泛
化的图神经网络预测方法及系统。 该方法包括:
1)把社交网络数据中打标签的数据作为训练数
据集, 每个节点代表一个用户, 两个节点之间的
边代表两个用户彼此是好友关系; 2)对训练数据
集进行随机采样, 形成不同批次的训练数据; 3)
利用不同批次的训练数据更新聚类中心, 划分不
同的子图, 每个子图包含的用户由聚类中心决
定; 4)利用上一步得到的不同的子图, 更新图神
经网络参数; 5)利用更新后的图神经网络参数,
进行社交网络用户标签的预测, 从而预测该用户
的社交信。 本发 明将图神经网络应用于分布外的
社交网络预测。 相比一般图神经网络算法, 本发
明对训练集分布外的测试数据具有较强的鲁棒
性和准确率。
权利要求书3页 说明书8页 附图2页
CN 115293919 A
2022.11.04
CN 115293919 A
1.一种面向社交网络分布外泛化的图神经网络预测方法, 其特 征在于, 包括如下步骤:
S1、 把社交网络数据中标记有社交信息标签的数据作为训练数据集; 所述社交网络数
据以社交网络图的形式存储, 图中的每个节点代表一个用户, 若用户与用户之间存在社交
关系则在对应的两个用户节点之间建立边连接, 若用户与用户之 间不存在社交关系则 在对
应的两个用户节点之间不存在边连接;
S2、 对训练数据集进行随机采样, 形成不同批次的训练数据, 每一个批次的训练数据构
成一个社交图网络;
S3、 根据预先设定的用户聚类数目, 分别用一个第一图神经网络模为每个聚类簇的聚
类中心, 每个第一图神经网络的输入为社交图网络, 输出为社交图网络中每个用户节点的
社交信息标签; 选择一个批次的训练数据迭代更新聚类中心, 且聚类中心每更新一次, 社 交
网络图中的所有用户节点需被更新划分至对该用户的标签预测 准确度最高的第一图神经
网络所在的聚类簇中, 训练完毕后将社交网络图按照最终的聚类簇划分为多个子图;
S4、 利用S3中当前输入批次的训练数据对应的各子图迭代训练第二图神经网络, 第二
图神经网络的输入为子图, 输出为子图中每 个节点的社交信息标签;
S5、 利用S2中采集的不同批次的训练数据, 通过不断执行S3和 S4, 迭代训练第二图神经
网络, 直至第二图神经网络收敛;
S6、 利用训练得到的第二图神经网络对所述社交网络数据中的未知标签用户进行预
测, 得到各位置标签用户的社交信息标签。
2.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法, 其特征在于,
所述的S3具体包括以下子步骤:
S301、 根据预先设定的用户聚类数目N, 初始化N个图神经网络模型
作为N个聚类中
心, 其中θj为第j个图神经网络模型的参数;
S302、 选择一个批次的训练数据作为输入, 对当前输入批次的训练数据所对应的社交
图网络Gt, 初始化提取的图特征Ψ=Gt, 同时将社交图网络 Gt中的所有用户节 点初始化划分
至当前最 新的N个图神经网络模型
对应的聚类簇中;
S303、 对每个聚类中心对应的图神经网络模型
通过最小化损失函数hj(Ψ,Y)进行
一轮更新:
其中Y是社交图网络Gt中用户节点的社交信息 标签真值, Ψ是图神经网络模型中的特征
提取操作, Ψ的输入 是Xj和A, Xj是社交图网络Gt中当前属于第j 个聚类簇的节 点特征, A是社
交图网络Gt中与Xj中所包含的节点相关的邻边数据,
输出社交图网络Gt中用
户节点的社交信息标签预测值;
S304、 根据S303中更新后的各聚类中心对应的图神经网络模型
对社交图网络Gt中的
所有用户节点重新进 行划分, 每个用户节点被划分至对该用户节点的社交信息标签预测准
确度最高的图神经网络模型 所对应的聚类簇中;
S305、 不断迭代重复S303和S304, 从而将当前输入批次的训练数据中相似的图数据聚权 利 要 求 书 1/3 页
2
CN 115293919 A
2类在一起, 而将不相似的图数据分隔开, 迭代结束后以每一个聚类簇中的用户节点构建一
个子图, 子图中用户节点之间的边连接与社交图网络Gt一致。
3.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法, 其特征在于,
所述的S4中第二图神经网络的具体训练方法如下:
利用S3中基于当前输入批次的训练数据所得到的不同子图, 训练第二图神经网络, 更
新图神经网络参数, 训练采用的损失函数为:
其中: Xe,Ae分别是第e个子图中的节点特征和邻边数据; θ是第二图神经网络GNN的参
数;
表示计算损失的期望, l表示损失计算函数; Ye是第e个子图中用户节点的社交信息
标签真值, GNN(Ψ(Xe,Ae); θ )输出第e个子图中用户节点的社交信息标签预测值, e=1,
2,…,N。
4.如权利要求2所述的面向社交网络分布外泛化的图神经网络预测方法, 其特征在于,
所述用户聚类数目N =2~5。
5.如权利要求3所述的面向社交网络分布外泛化的图神经网络方法, 其特征在于, 所述
损失计算 函数l为交叉熵损失函数。
6.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法, 其特征在于,
所述第一图神经网络和第二图神经网络均为带有分类 器的图神经网络 。
7.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法, 其特征在于,
所述社交网络数据中, 两个用户之 间存在社交关系和不存在社 交关系分别表示这两个用户
之间存在关联 联系和不存在关联 联系, 用户的社交信息标签为用户的分类 类型标签。
8.一种面向社交网络分布外泛化的图神经网络预测系统, 其特 征在于, 包括:
数据获取模块, 用于把社交网络数据中标记有社交信息标签的数据作为训练数据集;
所述社交网络数据以社交网络图的形式存储, 图中的每个节点代表一个用户, 若用户与用
户之间存在社 交关系则 在对应的两个用户节点之间建立边连接, 若用户与用户之 间不存在
社交关系则在对应的两个用户节点之间不存在边连接;
采样模块, 用于对训练数据集进行随机采样, 形成不同批次的训练数据, 每一个批次的
训练数据构成一个社交图网络;
子图划分模块, 用于根据预先设定的用户聚类数目, 分别用一个第一图神经网络模为
每个聚类簇的聚类中心, 每个第一图神经网络的输入为社交图网络, 输出为社交图网络中
每个用户节点的社交信息标签; 选择一个批次的训练数据迭代更新聚类中心, 且聚类中心
每更新一次, 社交网络图中的所有用户节点需被更新划分至对该用户的标签预测准确度最
高的第一图神经网络所在的聚类簇中, 训练完 毕后将社交网络图按照最 终的聚类簇划分为
多个子图;
图网络更新模块, 用于利用子图划分模块中当前输入批次的训练数据对应的各子图迭
代训练第二图神经网络, 第二图神经网络的输入为子图, 输出为子图中每个节点的社交信
息标签;
迭代训练模块, 用于利用采样模块中采集的不同批次的训练数据, 通过不断执行子 图
划分模块和图网络更新模块, 迭代训练第二图神经网络, 直至第二图神经网络收敛;权 利 要 求 书 2/3 页
3
CN 115293919 A
3
专利 面向社交网络分布外泛化的图神经网络预测方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:00:03上传分享