NLP——基于深度学习的自然语言处理

最新推荐文章于 2024-06-17 19:50:21 发布

beautyfairy

最新推荐文章于 2024-06-17 19:50:21 发布

阅读量475

点赞数 1

分类专栏： NLP 文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/beautyfairy/article/details/120709113

版权

本文介绍了自然语言处理（NLP）中深度学习的应用，包括One-hot编码和Embedding编码的区别，重点讨论了词向量模型Word2Vec的skip-gram和CBOW两种方法。skip-gram关注预测上下文单词，而CBOW则关注预测中间词，两种方法各有优劣。

摘要由CSDN通过智能技术生成

NLP

编码方式

One-hot独热编码（人为规定）

特征系稀疏
词之间相互独立
不能表征词与词之间的关系，one-hot之间正交

Embedding编码（词向量矩阵）

特征稠密
能够表征词语词之间的互相关系
泛化性更好（one-hot与之相比就是完全命中），支持语义计算

词监督词向量方法

词向量模型（Word2Vec)

skip-gram（自监督学习）
skip-gram目标是：最大化上下文单词的预测概率

skip-gram过程如下图所示：

在这里插入图片描述

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
NLP——基于深度学习的自然语言处理

NLP编码方式One-hot独热编码（人为规定）特征系稀疏词之间相互独立不能表征词与词之间的关系，one-hot之间正交Embedding编码（词向量矩阵）特征稠密能够表征词语词之间的互相关系泛化性更好（one-hot与之相比就是完全命中），支持语义计算词监督词向量方法自监督学习skip-gramskip-gram目标是：最大化上下文单词的预测概率skip-gram过程如下图所示：eg:CBoWCBoW目标是：最大化中间词的预测概率CBoW过程
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。