词处理之词向量

最新推荐文章于 2024-06-19 17:56:13 发布

搬用工tyler

最新推荐文章于 2024-06-19 17:56:13 发布

阅读量579

点赞数

分类专栏：自然语言处理文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dagedainingjin/article/details/105131482

版权

自然语言处理专栏收录该内容

13 篇文章 0 订阅

订阅专栏

概念

把词转换成数值形式，或者说——嵌入到一个数学空间里，这种嵌入方式，就叫词嵌入（word embedding)，而 Word2vec，就是词嵌入（ word embedding) 的一种。

词的表示

one-hot
word embedding，腾讯AI Lab有训练好的词向量，TensorFlow中embedding层也可以
word2vec，gensim工具包提供使用

word2vec

1.跳字模型（skip-gram）

将CBOW模型倒过来

2.连续词袋模型（continuous bag of words，简称CBOW）

算法过程：
1.输入层：上下文单词的onehot。（假设单词向量空间dim为V，上下文单词个数为C）
2.所有onehot分别乘以共享的输入权重矩阵W（VN矩阵，N为自己设定的数，初始化权重矩阵W）
3.所得的向量（注意onehot向量乘以矩阵的结果）相加求平均作为隐层向量, size为1N.
4.乘以输出权重矩阵W’ {NV}
5.得到向量 {1V} 激活函数处理得到V-dim概率分布 {PS: 因为是onehot嘛，其中的每一维斗代表着一个单词}，概率最大的index所指示的单词为预测出的中间词（target word）
6.与true label的onehot做比较，误差越小越好。loss function（一般为交叉熵代价函数）
示意图

3.训练注意事项：

1.负采样（negative sampling）
2.层序softmax（hierarchical softmax）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
词处理之词向量

概念把词转换成数值形式，或者说——嵌入到一个数学空间里，这种嵌入方式，就叫词嵌入（word embedding)，而 Word2vec，就是词嵌入（ word embedding) 的一种。词的表示one-hotword embeddingword2vecword2vec1.跳字模型（skip-gram）将CBOW模型倒过来2.连续词袋模型（continuous bag of...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。