目的:political观点预测,过去工作关注语义信息,很少利用社交和political·背景进行political立场分析。
方法概述:利用外部信息(外部political知识图,1071个实体和10703个三元组)和新闻文章建立一个异质的图网络,利用图卷积网络进行图分类;
1.构建一个当代political知识图作为新闻文本的外部信息
2.学习实体和关系的嵌入表示(为上述构建的外部知识图)
3.建立一个异质的信息网络,包括新闻文本的内容和提到的实体
4.构建模型对political进行观点预测
方法详述:
1:首先获得political实体,然后在维基百科检索实体之间的关系,得到三元组。political图如下:
2.图嵌入表示
将{实体,关系,三元组}使用TransE进图表示,得到实体和关系的向量
3.新闻文档嵌入表示
使用语言模型,预训练语言模型对文本信息进行向量表示。本文使用RoBERT进行编码
d表示新闻的标题,p表示新闻中不同的段落
3.图结构
HINs:异质信息的网络结构
异质信息就是包括文本信息和实体信息,具体如下表:
把标题,段落,实体的向量输入到全连接层获得向量表示。。。
文章标题
段落
实体
定义完节点后,再定义三种不同类型的边:O = doc -para; para-para; para-ent
最后新闻和外部信息整合为如下结构:
RGCN提供了一个异构图多关系融合方案的尝试版,那HAN就是在这个的基础上,把Attention给加进来了,并添加了一个分层的粒度attention(node-level attention 与semantic-level attention)的结构
4.学习和优化过程
一顿公式计算-----反正得到的是整个图的向量表示vg。
模型的预测
损失函数,y是新闻的文章数,Y是预测的标签,
可学习参数,
超参数。
5.数据集
6.baselines
7.实验环境
8.实验结果