专利 面向社交网络分布外泛化的图神经网络预测方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221087141 1.2 (22)申请日 2022.07.22 (71)申请人浙江大学地址 310058 浙江省杭州市西湖区余杭塘路866号 (72)发明人况琨　陈政聿　吴飞　 (74)专利代理机构杭州求是专利事务所有限公司 33200 专利代理师傅朝栋　张法高 (51)Int.Cl. G06Q 50/00(2012.01) G06F 16/901(2019.01) G06V 10/774(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称面向社交网络分布外泛化的图神经网络预测方法及系统 (57)摘要本发明公开了一种面向社交网络分布外泛化的图神经网络预测方法及系统。该方法包括： 1)把社交网络数据中打标签的数据作为训练数据集，每个节点代表一个用户，两个节点之间的边代表两个用户彼此是好友关系； 2)对训练数据集进行随机采样，形成不同批次的训练数据； 3) 利用不同批次的训练数据更新聚类中心，划分不同的子图，每个子图包含的用户由聚类中心决定； 4)利用上一步得到的不同的子图，更新图神经网络参数； 5)利用更新后的图神经网络参数，进行社交网络用户标签的预测，从而预测该用户的社交信。本发明将图神经网络应用于分布外的社交网络预测。相比一般图神经网络算法，本发明对训练集分布外的测试数据具有较强的鲁棒性和准确率。权利要求书3页说明书8页附图2页 CN 115293919 A 2022.11.04 CN 115293919 A 1.一种面向社交网络分布外泛化的图神经网络预测方法，其特征在于，包括如下步骤： S1、把社交网络数据中标记有社交信息标签的数据作为训练数据集；所述社交网络数据以社交网络图的形式存储，图中的每个节点代表一个用户，若用户与用户之间存在社交关系则在对应的两个用户节点之间建立边连接，若用户与用户之间不存在社交关系则在对应的两个用户节点之间不存在边连接； S2、对训练数据集进行随机采样，形成不同批次的训练数据，每一个批次的训练数据构成一个社交图网络； S3、根据预先设定的用户聚类数目，分别用一个第一图神经网络模为每个聚类簇的聚类中心，每个第一图神经网络的输入为社交图网络，输出为社交图网络中每个用户节点的社交信息标签；选择一个批次的训练数据迭代更新聚类中心，且聚类中心每更新一次，社交网络图中的所有用户节点需被更新划分至对该用户的标签预测准确度最高的第一图神经网络所在的聚类簇中，训练完毕后将社交网络图按照最终的聚类簇划分为多个子图； S4、利用S3中当前输入批次的训练数据对应的各子图迭代训练第二图神经网络，第二图神经网络的输入为子图，输出为子图中每个节点的社交信息标签； S5、利用S2中采集的不同批次的训练数据，通过不断执行S3和 S4，迭代训练第二图神经网络，直至第二图神经网络收敛； S6、利用训练得到的第二图神经网络对所述社交网络数据中的未知标签用户进行预测，得到各位置标签用户的社交信息标签。 2.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法，其特征在于，所述的S3具体包括以下子步骤： S301、根据预先设定的用户聚类数目N，初始化N个图神经网络模型作为N个聚类中心，其中θj为第j个图神经网络模型的参数； S302、选择一个批次的训练数据作为输入，对当前输入批次的训练数据所对应的社交图网络Gt，初始化提取的图特征Ψ＝Gt，同时将社交图网络 Gt中的所有用户节点初始化划分至当前最新的N个图神经网络模型对应的聚类簇中； S303、对每个聚类中心对应的图神经网络模型通过最小化损失函数hj(Ψ,Y)进行一轮更新：其中Y是社交图网络Gt中用户节点的社交信息标签真值， Ψ是图神经网络模型中的特征提取操作， Ψ的输入是Xj和A， Xj是社交图网络Gt中当前属于第j 个聚类簇的节点特征， A是社交图网络Gt中与Xj中所包含的节点相关的邻边数据，输出社交图网络Gt中用户节点的社交信息标签预测值； S304、根据S303中更新后的各聚类中心对应的图神经网络模型对社交图网络Gt中的所有用户节点重新进行划分，每个用户节点被划分至对该用户节点的社交信息标签预测准确度最高的图神经网络模型所对应的聚类簇中； S305、不断迭代重复S303和S304，从而将当前输入批次的训练数据中相似的图数据聚权　利　要　求　书 1/3 页 2 CN 115293919 A 2类在一起，而将不相似的图数据分隔开，迭代结束后以每一个聚类簇中的用户节点构建一个子图，子图中用户节点之间的边连接与社交图网络Gt一致。 3.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法，其特征在于，所述的S4中第二图神经网络的具体训练方法如下：利用S3中基于当前输入批次的训练数据所得到的不同子图，训练第二图神经网络，更新图神经网络参数，训练采用的损失函数为：其中： Xe,Ae分别是第e个子图中的节点特征和邻边数据； θ是第二图神经网络GNN的参数；表示计算损失的期望， l表示损失计算函数； Ye是第e个子图中用户节点的社交信息标签真值， GNN(Ψ(Xe,Ae)； θ )输出第e个子图中用户节点的社交信息标签预测值， e＝1, 2,…,N。 4.如权利要求2所述的面向社交网络分布外泛化的图神经网络预测方法，其特征在于，所述用户聚类数目N ＝2～5。 5.如权利要求3所述的面向社交网络分布外泛化的图神经网络方法，其特征在于，所述损失计算函数l为交叉熵损失函数。 6.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法，其特征在于，所述第一图神经网络和第二图神经网络均为带有分类器的图神经网络。 7.如权利要求1所述的面向社交网络分布外泛化的图神经网络预测方法，其特征在于，所述社交网络数据中，两个用户之间存在社交关系和不存在社交关系分别表示这两个用户之间存在关联联系和不存在关联联系，用户的社交信息标签为用户的分类类型标签。 8.一种面向社交网络分布外泛化的图神经网络预测系统，其特征在于，包括：数据获取模块，用于把社交网络数据中标记有社交信息标签的数据作为训练数据集；所述社交网络数据以社交网络图的形式存储，图中的每个节点代表一个用户，若用户与用户之间存在社交关系则在对应的两个用户节点之间建立边连接，若用户与用户之间不存在社交关系则在对应的两个用户节点之间不存在边连接；采样模块，用于对训练数据集进行随机采样，形成不同批次的训练数据，每一个批次的训练数据构成一个社交图网络；子图划分模块，用于根据预先设定的用户聚类数目，分别用一个第一图神经网络模为每个聚类簇的聚类中心，每个第一图神经网络的输入为社交图网络，输出为社交图网络中每个用户节点的社交信息标签；选择一个批次的训练数据迭代更新聚类中心，且聚类中心每更新一次，社交网络图中的所有用户节点需被更新划分至对该用户的标签预测准确度最高的第一图神经网络所在的聚类簇中，训练完毕后将社交网络图按照最终的聚类簇划分为多个子图；图网络更新模块，用于利用子图划分模块中当前输入批次的训练数据对应的各子图迭代训练第二图神经网络，第二图神经网络的输入为子图，输出为子图中每个节点的社交信息标签；迭代训练模块，用于利用采样模块中采集的不同批次的训练数据，通过不断执行子图划分模块和图网络更新模块，迭代训练第二图神经网络，直至第二图神经网络收敛；权　利　要　求　书 2/3 页 3 CN 115293919 A 3

专利 面向社交网络分布外泛化的图神经网络预测方法及系统

专利面向社交网络分布外泛化的图神经网络预测方法及系统