论文笔记:Encoding Social Information with Graph Convolutional Networks forPolitical Perspective *****

Encoding Social Information with Graph Convolutional Networks for Political Perspective Detection in News Media

判断文本的意识形态,利用传播信息的社会背景来缓解这个问题,在无法获得直接监督时,提供基于认可文本内容并传播该内容的用户信息的远程监督来源(文档级别的分类依赖于通过社交网络传播的意识形态)

嵌入的文档不止需要考虑其文本的内容,也要从其属于的社交网络中获得知识。

 

数据:我们关注美国新闻报道。我们的语料库由超过10k篇文章组成,涵盖超过2k个不同的新闻事件,大约94个不同的主题,发生在8年的时间里。我们删除了关于文章来源的任何信息,使用众包方式对文章的意识形态进行标注;只依赖文本和社交媒体上对它的反应。为了捕捉这些信息,我们收集了一组在推特上分享新闻文章的1.6k用户,少数政治用户被分享文章的用户所关注。该问题作为分类问题(左倾右倾中立)。

数据分割:随机分,按照事件分,按照时间分,事件的相同事件在同一文件夹中,按照时间分,将时间平均分为三段。

 

图构建:G={V, E}

V:节点,P(已知意识形态的人物和机构),U(普通用户,意识形态未知,但是他们经常分析新闻文章,以及关注P),A(被用户分享的新闻文章)

E:边  U--P的边,表示关注;  A--U的边,表示分享;

新闻文本的特征向量表示,(仅使用文本和标签得到一个结果):

 

图谱的特征表示:将所有的图节点映射到一个低维向量空间中,这样图的关系就保留在嵌入空间中。在共享嵌入空间中,图中连接(或接近)的节点在其向量表示之间应该具有更高的相似性分数。

图中的两种不同关系分别定义损失函数。

正确标签的负对数似然作为分类训练损失:

最终损失函数定义为:

使用GCN获取图的节点的特征表示:

得到文档的特征表示。

联合模型:

 仅有少数政治家(已知意识形态)充当标签;(远程监督

把新闻的标签也给出(完全监督

达到的目的,给出一篇新闻的社会背景,就能知道这篇新闻的意识形态

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值