nlp入门4——文本的向量化表示（嵌入）

最新推荐文章于 2024-10-06 23:43:09 发布

qishanbaby

最新推荐文章于 2024-10-06 23:43:09 发布

阅读量81

点赞数

分类专栏： nlp 文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qishanbaby/article/details/133185987

版权

nlp 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

一、怎么得到词向量（稠密表示）

1.原理理解

输入前四个词（ $c_{i-1}$ ~ $c_{i-4}$ 的特征）希望输出的词为 C 的概率最大

one-hot在一个词典大小的空间（特别大1*40000）——> 使用矩阵来映射（40000*300维）——>向量相乘 ——> 得到1*300维的向量

一个词的one-hot编码 * 这个词典的稠密向量表示 = 这个词的稠密向量编码（定位词）

2.预期结果

使用不同语料库训练得到的语言模型不同，分类预测的结果不一样

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

qishanbaby CSDN认证博客专家 CSDN认证企业博客

码龄2年

35: 原创

136万+: 周排名

125万+: 总排名

3475: 访问

: 等级

352: 积分

3: 粉丝

0: 获赞

7: 评论

1: 收藏

私信

关注

热门文章

分类专栏

算法
nlp 11篇
pytorch 1篇
神经网络 1篇
python 2篇
深度学习 10篇
c++网络编程 1篇
代码随想录 7篇

最新评论

LeetCode 239. 滑动窗口最大值代码随想录刷题日记
CSDN-Ada助手: 恭喜您写完了第7篇博客！看到您坚持创作，我感到非常高兴。这篇博客的标题非常吸引人，内容也很有深度。不过，我认为您可以进一步提升读者的体验。下一步，您可以考虑在博客中加入更多的实例和案例，以帮助读者更好地理解您的解题思路。同时，您也可以考虑增加一些与问题相关的技巧或优化方法，以便读者可以在解决类似问题时有更多的选择。希望能看到更多您的创作，加油！
LeetCode 347. 前 K 个高频元素刷题日记
CSDN-Ada助手: 恭喜您写完了第8篇博客！标题看起来非常吸引人，也很期待能够读到您的刷题日记。您的持续创作精神值得称赞！在下一步的创作中，或许可以考虑分享一些关于解题思路的心得体会，或者结合实际应用场景，给出一些优化算法的建议。希望您能够继续保持谦虚的态度，以便更好地吸引读者并提升自己的写作技巧。期待您的下一篇博客！
动手学深度学习 24 深度学习网络AlexNet
CSDN-Ada助手: 恭喜您写了第14篇博客，题为“动手学深度学习 24 深度学习网络AlexNet”。您对深度学习的持续学习和分享让人佩服。在我看来，您对AlexNet的解析非常详细，给读者提供了深度学习网络的全面了解。接下来，我想建议您在未来的创作中可以考虑探索其他深度学习网络的原理和应用，这样可以为读者提供更多选择和广阔的学习领域。谢谢您的辛勤付出，期待您的下一篇博客！
动手学深度学习 25 使用块的网络 VGG
CSDN-Ada助手: 恭喜您撰写第15篇博客！标题中提到的使用块的网络VGG是一个非常有趣的话题。您在这篇博客中详细介绍了如何动手学习深度学习，并借助VGG网络实现了特定功能。我真的很喜欢您的创作风格，简洁明了，易于理解。在接下来的创作中，我建议您可以考虑探索一些更加高级的深度学习技术，例如残差网络（ResNet）或生成对抗网络（GAN），这些网络在图像识别和生成方面具有重要应用。希望您能够继续保持持续创作的动力，并为我们带来更多精彩的教程和分享。谢谢您的分享，期待您下一篇博客的发布！
代码随想录刷题日记螺旋矩阵
是小企鹅呀: 真人评论来啦~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。