[论文] Bilingual Sentiment Embeddings: Joint Projection of Sentiment Across Languages

Bilingual Sentiment Embeddings:

Joint Projection of Sentiment Across Languages

 

摘要:

低资源语言中的情感分析缺乏注释的语料库

解决方法:

机器翻译

双语词嵌入

缺点:

大量的并行数据

不能很好地捕获情绪信息

提出:

Bilingual Sentiment Embeddings (BLSE)双语情感嵌入

条件:

a small bilingual lexicon双语词典

a source-language corpus annotated for sentiment注释情感的源语言语料库

monolingual word embeddings for each language 每种语言的单语词嵌入

结果:

三种语言组合(西班牙语,加泰罗尼亚语,巴斯克语)进行句子级跨语言情感分类的实验,并发现我们的模型在六个实验设置中的四个中显着优于最先进的方法

总结:

得到的嵌入空间对资源匮乏没有该语言中的任何注释数据的目标语言能够表示出情感信息。

 

介绍:

情绪分析的跨语言方法是由于绝大多数语言缺乏培训数据。

目标是利用在源语言丰富的语言知识。

 

已应用于跨语言情感分析的多语言方法的示例包括

domain adaptation methods (Prettenhofer and Stein, 2011)领域适应方法

delexicalization (Almeida et al., 2015)非词语化

bilingual word embeddings (Mikolovet al., 2013; Hermann and Blunsom, 2014; Artetxe

et al., 2016). 双语词嵌入

缺点:没有包含足够的情绪信息以便在跨语言中表现良好

 

六个基准测试中几乎在所有实验设置中都优于以前最先进的模型

证明我们的模型意识到情绪

 

 

 

 

 

模型:

跨语言投射:

 在训练期间,对于L中的每个词对,我们首先查找它们的相关向量,通过它们的相关投影矩阵投影它们,并最终最小化两个投影向量的均方误差。

 

情绪分类:

优化预计的源向量,以预测源短语的情绪,改变了矩阵M,M’因最小化均方误差得到改变,鼓励M'学习预测情绪而没有目标语言中的任何训练示例。

 

联合投影和情绪分类:

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值