论文笔记《Domain Adapted Word Embeddings for Improved Sentiment Classification》

最新推荐文章于 2022-02-15 19:17:17 发布

ttv56

最新推荐文章于 2022-02-15 19:17:17 发布

阅读量542

点赞数

分类专栏：自然语言处理文章标签：自然语言处理

本文链接：https://blog.csdn.net/u014475479/article/details/81591790

版权

自然语言处理专栏收录该内容

17 篇文章 2 订阅

订阅专栏

原文链接
本文发表于自然语言处理领域顶级会议 ACL 2018

摘要

通用的词语embedding是在大规模语料下训练出来的具有通用性的特点，但在特定领域表现欠佳，而特定领域的词语embedding仅在特定领域能够使用，欠缺通用性。本文提出了一种兼具通用性和领域性的词语embedding方式，实验效果不错。

模型

设矩阵 $W_{DS} \in R^{|V_{DS}|\times d_1}$ 的每一列都是特定领域的词语的embedding向量，令 $w_{i,DS}$ 为 $DS$ 中词语 $i$ 的embedding，其中 $V_{DS}$ 是该领域词语的集合， $d_1$ 是词向量的维度。类似的，我们设 $W_{G} \in R^{|V_{G}|\times d_2}$ 为通用词语向量组成的矩阵。设 $V_{\bigcap}=V_{DS}\bigcap V_G$ ，令 $w_{i,G}$ 为 $V_{\bigcap}$ 中词语 $i$ 的embedding。令 $\phi_{DS}$ 和 $\phi_{G}$ 分别为 $w_{i,DS}$ 和 $w_{i,G}$ 的映射矩阵，我们进行如下映射：

w ⎯ ⎯ ⎯ ⎯ i, D S = w i, D S ϕ D S

$\overline{w}_{i,DS}=w_{i,DS}\phi_{DS}$

w ⎯ ⎯ ⎯ ⎯ i, G = w i, G ϕ G

$\overline{w}_{i,G}=w_{i,G}\phi_{G}$
这样我们就可以通过去使

w⎯⎯⎯⎯i,DS w ¯ i , D S $\overline{w}_{i,DS}$ 与

w⎯⎯⎯⎯i,G w ¯ i , G $\overline{w}_{i,G}$ 相关度最大，从而列式计算出

ϕDS ϕ D S $\phi_{DS}$ 和

ϕG ϕ G $\phi_{G}$ 来，本文把这种操作称之为CCA，公式如下所示：
这里写图片描述

其中

ρ ρ $\rho$ 为

ϕDS ϕ D S $\phi_{DS}$ 和

ϕG ϕ G $\phi_{G}$ 的相关度，

E E $E$ 为

V_{⋂}

$V_{\bigcap}$ 中所有单词的期望。

$\color{red}{（两条横线之间的这一段先别看，原文没太看懂）}$
第 $d$ 个维度的CCA可以被递归地求出来：假设我们已经求出来了前 $d-1$ 个维度，那么第 $d$ 个维度可以通过求解使相关函数最大的变量来得出（约束条件为第 $d$ 个维度与前 $d-1$ 个维度不相关），设 $\Phi_{DS} \in R^{d_1*d}$ 和 $\Phi_{G} \in R^{d_2*d}$ 为 $W_{DS}$ 和 $W_{G}$ 中向量的映射的集合，其中 $d<=min\lbrace d_1,d_2 \rbrace$

单词的最终embedding表示由 $\hat{w}_{i,DA}=\alpha \overline{w}_{i,DS}+\beta \overline{w}_{i,G}$ 得出，其中 $\alpha$ 和 $\beta$ 通过解如下优化问题得出：
这里写图片描述
解得 $\alpha = \beta = \frac{1}{2}$ ，于是我们得出：