自然语言处理基础梳理

最新推荐文章于 2024-03-18 15:45:19 发布

爱在桂子山

最新推荐文章于 2024-03-18 15:45:19 发布

阅读量90

点赞数

分类专栏：自然语言处理系列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38690917/article/details/115839860

版权

自然语言处理系列专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、TF-IDF

TF代表一个文档里的词频

IDF代表所有文档里的词频，代表全局信息

TF-IDF将TF和IDF相乘，是基于统计学的方法

2、词向量

CBOW：挑一个要预测的词来学习这个词前后文中词语和预测词的关系

Skip-Gram：把上述过程反过来，使用文中某个词，然后预测这个词周边的词

3、句向量

词向量加工成句向量：Encoding过程，进行压缩，到另一个向量空间，然后Decoding，解压

seq2seq：Encoding为LSTM

CNN：Encoding为卷积，卷积核的意思是把几个字连着一起看

Decoding时把预测的值作为下一步的输入

爱在桂子山

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
自然语言处理基础梳理

1、TF-IDFTF代表一个文档里的词频IDF代表所有文档里的词频，代表全局信息TF-IDF将TF和IDF相乘，是基于统计学的方法2、词向量CBOW：挑一个要预测的词来学习这个词前后文中词语和预测词的关系Skip-Gram：把上述过程反过来，使用文中某个词，然后预测这个词周边的词3、句向量词向量加工成句向量：Encoding过程，进行压缩，到另一个向量空间，然后Decoding，解压seq2seq：Encoding为LSTMCNN：Encoding为卷积，卷积核的意思
复制链接

扫一扫

专栏目录

爱在桂子山 CSDN认证博客专家 CSDN认证企业博客

码龄7年

57: 原创

22万+: 周排名

4万+: 总排名

10万+: 访问

: 等级

903: 积分

963: 粉丝

78: 获赞

34: 评论

258: 收藏

私信

关注

分类专栏

配置环境付费 10篇
容器
Docker 1篇
中间件
kafka 1篇
面经 7篇
Go 6篇
RPC 5篇
gin 4篇
杂记 5篇
QT 2篇
资源 1篇
自然语言处理系列 4篇
pytorch学习笔记 2篇
python学习笔记 3篇
python代码 2篇
数学知识 1篇
java代码 1篇
C++代码 1篇
大数据系列 2篇

最新评论

C++临时小记
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
Ubuntu下安装yum和配置yum源
尹尹尹尹: 执行报错： Error: Cannot retrieve repository metadata (repomd.xml) for repository: fedora. Please verify its path and try again
配置tmux在服务器重启后恢复工作环境
一一佰: 请问保存多个会话，之后如何选择加载哪一个啊？
Sentencepiece构建词典
John Rosenberg: 好文，感谢。
Ubuntu下安装yum和配置yum源
董小姐yyds: 报错Total size: 18 M Installed size: 134 M Downloading Packages: warning: /var/cache/yum/fedora/packages/ncurses-libs-5.9-4.20120204.fc17.x86_64.rpm: Header V3 RSA/SHA256 Signature, key ID 1aca3465: NOKEY Retrieving key from file:///etc/pki/rpm-gpg/RPM-GPG-KEY-fedora-x86_64 GPG key retrieval failed: [Errno 14] curl#37 - "Couldn't open file /etc/pki/rpm-gpg/RPM-GPG-KEY-fedora-x86_64"

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

爱在桂子山 再不打赏我就失业了

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。