Trm理论 2（Word2Vec）

我.佛.糍.粑

已于 2024-09-04 01:35:15 修改

阅读量519

点赞数 5

文章标签：自然语言处理人工智能

于 2024-09-04 01:34:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_81989837/article/details/141875064

版权

神经网络模型（NNLM）和Word2Vec

NNLM模型是上次说过的模型，其目的是为了预测下一个词。
softmax(w2tanh(w1x + b1)+b2)
会得到一个副产品词向量
而Word2Vue就是专门求词向量的模型
softmax(w2*(w1*x + b1)+b2)

Word2Vec

softmax(w2*(w1*x + b1)+b2)，Word2vec比NNLM少了一个激活函数tanh，其原因是word2vec目的是求词向量，并不需要预测结果的准确性，只需要反向传播能正常进行即可。
Word2Vec分为两种
CBOW和skip-gram
在这里插入图片描述
左图是CBOM，右图是skip-gram
word2vue的目的是训练得到Q矩阵，并非预测词，因此重要的是训练过程
CBOM像是一个老师训练多个学生，skip-gram是一堆老师训练一个学生

CBOM

CBOM是用一个词的上下文预测出这个词，“这是一瓶很好喝的牢大冰红茶”，分词后，输入“这是一瓶很__牢大冰红茶”

skip-gram

skip-gram是用一个词，预测出他的上下文，输入“很好喝的”，输出“这是一瓶很__牢大冰红茶”

Word2Vec的缺点

Q矩阵的形成是由训练的数据决定的，因此当你使用训练好的Q矩阵应用于下游任务时，会出错。
举个例子，训练Q矩阵时，所有的苹果意思就是水果，而应用于下游任务的时候，我想表达苹果手机，预测就会出现相差很大的问题

word2vec的下游任务改造

word2vec得到的Q矩阵是预训练的一种
首先得到下游任务的独热编码，在使用word2vec的Q矩阵得到词向量，最后进行接下来的任务。

学习视频连接如下

该文章是学习b站up主水论文的程序员的笔记，链接如下可自行学习

https://www.bilibili.com/video/BV1mZ4y1q7J2/?spm_id_from=333.788&vd_source=2910693b31a0847b17a3d12d76d0e3f1

我.佛.糍.粑

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

我.佛.糍.粑 CSDN认证博客专家 CSDN认证企业博客

码龄1年

27: 原创

53万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

568: 积分

145: 粉丝

296: 获赞

7: 评论

182: 收藏

私信

关注

热门文章

最新评论

Pytorch 9
ha_lydms: 牛牛牛！太全面了，以后要用，忘记了直接来这里找表情包
吴恩达深度学习笔记.第二课第一周
CSDN-Ada助手: 恭喜您撰写了第13篇博客！阅读您关于吴恩达深度学习笔记的文章让我受益匪浅。建议在未来的创作中，可以逐步深入探讨吴恩达教授在深度学习领域的研究成果，并结合实际案例进行分析，让读者更加深入地了解相关知识。期待您在下一篇博客中的精彩内容！继续加油！
吴承恩深度学习第四周编程作业
CSDN-Ada助手: 恭喜用户第12篇博客的成功发布！看到你对吴承恩深度学习第四周编程作业的分享，让我感到非常兴奋。接下来，我建议你可以尝试扩展主题范围，探讨一些相关领域的知识，或者分享一些自己的学习心得和体会。希望你能够继续保持创作的热情，不断提升自己的写作水平和思考深度。加油！
吴承恩深度学习课程.第四周笔记
CSDN-Ada助手: 恭喜您完成了第11篇博客《吴承恩深度学习课程.第四周笔记》，持续创作不易，您的努力和坚持让人钦佩。希望您能继续保持学习的热情和耐心，多分享自己的学习心得和经验，或许可以结合实践案例或者个人见解，让读者更易于理解和接受。期待您的下一篇作品！愿您在学习和写作的路上不断进步，谦虚谨慎，保持初心。
统计学笔记.对照试验,抽样方法和调查偏差
CSDN-Ada助手: 恭喜用户在统计学领域继续深入学习，第6篇博客涵盖了对照试验、抽样方法和调查偏差的内容，内容丰富而深刻。建议用户在未来的创作中，可以结合实际案例或者应用场景，进一步展开对这些主题的讨论，让读者更容易理解和应用。期待用户更多精彩的博客作品！

大家在看

QD1-P14 HTML常用标签：input输入标签

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。