word2vec公式推导及原理简记

最新推荐文章于 2024-05-30 15:58:15 发布

今天也要笑笑鸭

最新推荐文章于 2024-05-30 15:58:15 发布

阅读量925

点赞数

分类专栏：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/silent_crown/article/details/84786404

版权

word2vec通过向量表示词语，采用CBOW和skip-gram模型，结合层次softmax和负采样进行训练。该模型利用词频构建哈夫曼树优化预测速度，同时通过负采样简化模型并提高效率。通过对模型的公式推导，理解了词向量如何反映词之间的差异和相关性。

摘要由CSDN通过智能技术生成

https://www.cnblogs.com/pinard/p/7243513.html

http://www.cnblogs.com/pinard/p/7249903.html

word2vec区别于one_hot映射方法，将词向量赋予含义并映射到向量空间，通过向量减法、点乘表示两词相差、相关性。
两种预测模型：Cbow(周围词向量预测中间词向量)和skip-gram(中间词向量预测周围词向量)。（设计的时候，预测谁就走谁的路径，用谁预测就用谁的vector,修正谁）
两种训练模型：Hierachical softmax（huffman树）和negtive sampling（权重采样负例）。

Hierachical softmax：(以Cbow为例, skip-gram的区别只是一开始和误差叠加到一个向量。)
用huffman树代替传统神经网络，速度快。但是对出现频率少对词需要对路径较长，比较慢。

按照词频构建哈夫曼树。
先把周围词向量加和，然后 $\sigma \left (x_{i} \Theta^{T} \right )$ 为预测值。
顺着哈夫曼树走，

最低0.47元/天解锁文章

今天也要笑笑鸭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
word2vec公式推导及原理简记

https://www.cnblogs.com/pinard/p/7243513.htmlhttp://www.cnblogs.com/pinard/p/7249903.htmlword2vec区别于one_hot映射方法，将词向量赋予含义并映射到向量空间，通过向量减法、点乘表示两词相差、相关性。两种预测模型：Cbow(周围词向量预测中间词向量)和skip-gram(中间词向量预...
复制链接

扫一扫

专栏目录

今天也要笑笑鸭 CSDN认证博客专家 CSDN认证企业博客

码龄7年

31: 原创

26万+: 周排名

34万+: 总排名

6万+: 访问

: 等级

963: 积分

5: 粉丝

20: 获赞

14: 评论

73: 收藏

私信

关注

热门文章

分类专栏

最新评论

文本分类任务中tf-idf的理解
今天也要笑笑鸭: 你动脑子仔细看看呢这都看不懂别玩机器学习了吧
文本分类任务中tf-idf的理解
qq_36415526: 确定公式和举得例子是保持一致的？你这有没有认真核实一下自己写的文章呢？
svm的loss和梯度推导及代码
爱编程的小段: 我在这纠结半天我也觉得是对W求导，误导人啊
svm的loss和梯度推导及代码
一位以泪洗面的同学: [code=python] if margin > 0: loss += margin dW[:,y[i]] += -X[i].T dW[:,j] += X[i].T [/code] 楼主不是 j!=y_i 得x_i吗？为什么是 dW[:,y[i]] += -X[i].T 是加的负的这个呢？我是小白，求解答QAQ
gensim + tfidf计算句子之间相似度
零一睡不醒: index：每个item代表一个句子和其他句子的相似度。你这是从哪里看到的结论，求个链接。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。