自然语言处理word2vec的视频笔记-理论篇

最新推荐文章于 2022-01-11 20:58:52 发布

Walter_Silva

最新推荐文章于 2022-01-11 20:58:52 发布

阅读量463

点赞数

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gin077/article/details/84202775

版权

NLP 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

https://www.bilibili.com/video/av26923188?p=2

n=1的情况举例

词典的大小是指单词的个数

之前一直执着于一个词怎么样，其实nlp是关注整个上下文，也就是概率空间分布，联系到了数据挖掘、机器学习的本质，都是概率分布。如下图，英文中1，2，3，4，5和西班牙语的概率一致，这也是机器同翻的基础

输入层的词向量可以随机初始化，在模型训练过程中不断调节优化，这点和传统的神经网络模型不同。

最后的目的：每个词的词向量

下面是对上述神经网络的实现改进

一、Hierarchical Softmax：两种实现方式

CBOW：NN的输入是词的上下文，输出是词出现的概率

Skip-gram则相反

下面介绍CBOW

哈夫曼树：权重越高（在nlp中是出现频率越高）离树根越近

比如我们要训练的预料有10000个词，那在NN的输出softmax时去输出1万个概率值。于是把最常用的词放在离根据近的节点。

每次执行一个二分类，从根到叶子节点，一步步分层判断，这就是层次softmax的思想了。这里会用到sigmoid函数，广泛应用于二分类，比如逻辑回归。将负无穷到正无穷映射到0到1（概率），把它的导数推导一遍，做到烂熟于心

，

注意下图把传统的NN中的hidden layer去掉了

在上图中，比较重要的是哈夫曼树的设计和哈夫曼树中一次次该怎么分类

目标函数：最大似然函数

求解目标函数：求极大值，梯度上升方向，训练过程中，调节theta和x两个变量

二、Negative sample

对于语料库特别大的情况，哈夫曼树也会很复杂，所以希望减少负样本的规模

目标函数

求解

V(w)即为想要的词向量

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Walter_Silva CSDN认证博客专家 CSDN认证企业博客

码龄13年

72: 原创

8万+: 周排名

152万+: 总排名

9万+: 访问

: 等级

1517: 积分

18: 粉丝

31: 获赞

18: 评论

147: 收藏

私信

关注

热门文章

分类专栏

最新评论

个推教程--第一课--综述
彼方: 好文，已收藏，学习的道路上一起进步，也期待你的关注与支持！
个推教程--第一课--综述
我爱人工智能: 不错
个推教程--第一课--综述
LaoYuanPython: 点赞支持！博主辛苦了！谢谢分享！写得很用心，期待博主更多的精彩内容！最后拉个票，本人正参与博客之星评选，1月24、25日每天都可投票，敬请支持！谢谢！投票链接：[code=python] https://bss.csdn.net/m/topic/blog_star2020/detail?username=laoyuanpython [/code] 或到老猿博文首页内的置顶博文跳转！
个推教程--第一课--综述
普通网友: 都是博主辛苦创作，我来支持一下，奥利给！
个推教程--第一课--综述
普通网友: 果断进我的收藏夹了

大家在看

Visual Studio代码编辑快捷键

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。