深度学习NLP笔记（二）：Negative sampling（负采样）和Hierarchical softmax（层次softmax）

最新推荐文章于 2024-07-04 15:29:32 发布

二伟在努力

最新推荐文章于 2024-07-04 15:29:32 发布

阅读量5.1k

点赞数 4

分类专栏：深度学习NLP 文章标签：深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39527549/article/details/84784735

版权

本文详细介绍了基于skip-gram模型的两种训练方法：Negative sampling（负采样）和Hierarchical softmax（层次softmax）。负采样通过选取K个噪声词降低计算复杂度至与K相关；层次softmax利用二叉树结构将复杂度降至O(logV)，有效提升了训练效率。

摘要由CSDN通过智能技术生成

两种训练方法都基于skip-gram模型讲解。

一、Negative sampling（负采样）

构建词向量模型时，之所以会出现时间复杂度为词典大小v的情况，就在于softmax这个函数，它会把词典中的每一个词考虑进概率的表达式当中。
　　假设我们把中心词生成背景词这一事件分解为两个独立的事件：（ｉ）中心词ｗ_c和背景词w_o同时出现在训练窗口；（ii）中心词w_c和第K个噪声词w_K没有同时出现在训练窗口。我们可以使用sigmoid函数来表示中心词ｗ_c和背景词w_o同时出现在训练窗口的概率： $P(D=1|w_{o},w_{c})=\sigma (u_{o}^{T}v_{c})$ $\sigma (x)=\frac{1}{1+e^{-x}}$
　　D=1表示同时出现在训练窗口。
　　由上，可以推出联合概率，取对数可以得到： $logP(w_{o}|w_{c})=log\left [ P(D=1|w_{o},w_{c})\prod_{k=1,w_{k}\sim P(w)}^{K}P(D=0|w_{k},w_{c}) \right ]$

最低0.47元/天解锁文章

二伟在努力

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

二伟在努力 CSDN认证博客专家 CSDN认证企业博客

码龄7年

11: 原创

119万+: 周排名

153万+: 总排名

1万+: 访问

: 等级

307: 积分

9: 粉丝

10: 获赞

11: 评论

39: 收藏

私信

关注

热门文章

分类专栏

最新评论

将pcap文件处理成KDD99数据集格式
普通网友: 你好，问题解决了吗，可以提取出来吗
将pcap文件处理成KDD99数据集格式
guessMeWho: 你好啊，请问这个问题解决了吗？
将pcap文件处理成KDD99数据集格式
Tiamo_wey: 老板您好，请问您现在这个问题解决了吗？能提取出41项特征了吗？？谢谢！
将pcap文件处理成KDD99数据集格式
weixin_42146182: 兄弟你好啊，请问这个问题解决了吗
将pcap文件处理成KDD99数据集格式
本杰明刘能: C:\Program Files (x86)\Microsoft Visual Studio\2017\Community\Common7\IDE>cmake D:\kdd99_feature_extractor-master\CMakeLists.txt -- Selecting Windows SDK version 10.0.17763.0 to target Windows 10.0.18362. -- Could NOT find PCAP (missing: PCAP_INCLUDE_DIR PCAP_LIBRARY) -- ENV{PCAPDIR}= -- PCAP_FOUND=FALSE -- PCAP_LIBRARIES= -- PCAP_INCLUDE_DIR=PCAP_INCLUDE_DIR-NOTFOUND CMake Error: The following variables are used in this project, but they are set to NOTFOUND. Please set them or make sure they are set and tested correctly in the CMake files: PCAP_INCLUDE_DIR used as include directory in directory D:/kdd99_feature_extractor-master/src used as include directory in directory D:/kdd99_feature_extractor-master/src -- Configuring incomplete, errors occurred! See also "D:/kdd99_feature_extractor-master/CMakeFiles/CMakeOutput.log". See also "D:/kdd99_feature_extractor-master/CMakeFiles/CMakeError.log". windows10下用vs2017添加了command prompt后还是不行

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。