基于Huffman树的CBOW模型的理解

最新推荐文章于 2023-01-27 18:48:40 发布

生活不只*眼前的苟且

最新推荐文章于 2023-01-27 18:48:40 发布

阅读量2k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011734144/article/details/78674219

版权

机器学习专栏收录该内容

66 篇文章 20 订阅

订阅专栏

上面是从如下地址中截取的内容：https://www.zybuluo.com/Dounm/note/591752#mjx-eqn-eq4

下面说下我对它的理解

还是以“今天我和小明去北京玩” 这句为例

输入层： “小明”的前后三个词向量，即首先要把这些词全部表示成向量

投影层：将这写词的向量求和，得到的结果就是：

将投影层的向量输入到哈夫曼树中

哈夫曼树怎么来的？将语料库中词以及词出现的频率构造一颗哈夫曼树，默认左边(编码为0)是负类，右边(编码为1)是正类，哈夫曼树的叶子节点就是语料库中的所有的词

将向量Xw输入到哈夫曼树，在每个节点上进行二分类，每个节点上二分类的概率如下

这里的概率是逻辑回归概率模型

那么我们的目标是沿着哈夫曼树找到最终的叶子节点是“小明”，那么就求出走到“小明”这个叶子节点的路径的概率，其实就是将这条路线上的概率全部乘起来，然后极大化这个概率

这里也是采用随机梯度上升法

最后要对各个词的词向量进行更新。另外有一点：

哈夫曼树中，节点之间的连线其实也是一个神经网络连线，两个节点的连线其实也是由很多条连线组成，参数θ是一个权重向量

生活不只*眼前的苟且

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
基于Huffman树的CBOW模型的理解

上面是从如下地址中截取的内容：https://www.zybuluo.com/Dounm/note/591752#mjx-eqn-eq4下面说下我对它的理解还是以“今天我和小明去北京玩” 这句为例输入层： “小明”的前后三个词向量，即首先要把这些词全部表示成向量投影层：将这写词的向量求和，得到的结果就是：将投影层的向量输入到哈夫曼树中哈夫曼树怎么来的？将语料库中词
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。