自然语言处理-Word2Vector学习笔记

最新推荐文章于 2024-04-17 19:23:21 发布

summerfighting

最新推荐文章于 2024-04-17 19:23:21 发布

阅读量5k

点赞数

分类专栏：自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/summerfighting/article/details/81779244

版权

目录

自然语言处理与深度学习

神经网络模型

CBOW和Skip-gram

gensim库的应用简介

自然语言处理与深度学习

word2vec是自然语言处理中的一个非常重要的模型。word2vec是指把一个词转化成向量。我们为什么要把词转化成向量呢？通常情况下我们在做机器学习任务的时候，我们的输入是一个特征数据，特征数据是指数值型的东西，因为我们的机器是认识这些数值型的数据的，但是在我们的任务中，我们拿到的数据不光是数值型的，还有字符型的或者文本型的数据，对于这样的数据来说，为了让计算机认识这些数据，我们需要把这些词转化成向量，再把这些向量拼接在一起，把这些向量输入，那么我们就可以让计算机知道这些文本表达了什么含义了。自然语言处理最常见的几类应用如下图所示：

在自然语言处理中，比较重要的就是深度学习。深度学习基础的模型是神经网络，比如你想让你的机器学到东西，你给它指定了一个网络，在网络里，你给它指定了一个学习目标，比如说你定义好了一个损失函数，那么在神经网络的优化过程当中，它就会不断的朝着一个可优化的方向前进，如下图中的右图所示，最低点就是损失函数优化的目标。

为什么需要研究深度学习，如下图所示：

上面简述了自然语言处理和深度学习。下面我们来说一下语言模型，如下图所示：

机器翻译、拼写纠错和智能问答等在做一件事情的时候，都会涉及到语言模型，就是说他们接触的都是一句一句的话或者可能要把这些句子组合在一起，组合成一篇文章。例如下图中的机器翻译，机器翻译在翻译的过程中会从之前学习到的信息中，通常表示价格昂贵的词组是high price 而不是lar

最低0.47元/天解锁文章

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
自然语言处理-Word2Vector学习笔记

目录自然语言处理与深度学习语言模型词向量神经网络模型CBOW和Skip-gramgensim库的应用简介自然语言处理与深度学习word2vec是自然语言处理中的一个非常重要的模型。word2vec是指把一个词转化成向量。我们为什么要把词转化成向量呢？通常情况下我们在做机器学习任务的时候，我们的输入是一个特征数据，特征数据是指数值型的东西...
复制链接

扫一扫

专栏目录

summerfighting CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

77万+: 周排名

120万+: 总排名

5027: 访问

: 等级

61: 积分

5: 粉丝

0: 获赞

0: 评论

10: 收藏

私信

关注

热门文章

自然语言处理-Word2Vector学习笔记 5027

分类专栏

自然语言处理 1篇
深度学习 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。