word2vec之skip-gram模型

艾特小小

于 2018-01-15 14:35:26 发布

阅读量168

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a273967581/article/details/84914944

版权

在word2vec里面是使用一个简单的两层神经网络来训练的，一个隐层和一个softmax层。里面就有两组权值要训练，但是最后使用的时候只要只要第一组权值，也就是隐层的权值。

输入是一个one-hot的向量，隐层的权值matrix实际上就是每个词的向量，每一行代表一个词的向量，这样，一个ont-hot乘这个权值矩阵的时候，就相当于取了matrix的一行。

输出是一个softmax层，用来表示词典中每个词作为上下文的概率，目标是真正在上下文词出现的那个词的概率的位置接近1，这个位置就是这个上下文词的one-hot为1的那个位置。

举个例子：i love deep learning , 假设取中心词为deep，取window为1，这样输入的样本有两个：(deep, love), (deep, learning) ，当输入第一个样本的时候，输入是deep的one-hot，输出是一个概率分布，我们的目标就是love对应的那个位置的概率越大越好，学习过程就是和love的one-hot计算loss，来更新输出层／隐层的权值，第二个样本也是一样的计算。

有时候，词典会很大，比如10w，这样最后输出的softmax以及更新的时候计算量就会很大，为了解决这个问题，作者就提出了一些优化的手段，比如Hierarchical Softmax/Negative Sampling这些技巧来加快运算。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

艾特小小 CSDN认证博客专家 CSDN认证企业博客

码龄12年

48: 原创

9万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

390: 积分

61: 粉丝

94: 获赞

3: 评论

83: 收藏

私信

关注

热门文章

分类专栏

最新评论

synchronized加锁机制-偏向锁、轻量级锁、重量级锁
艾特小小: 好敷衍，我都差点以为是我小号了，仔细确定了下我确实没有小号，就这个12年的号。
java-cas原子操作
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
synchronized加锁机制-偏向锁、轻量级锁、重量级锁
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
数据库关于密码存储
普通网友: 十年大佬，失敬失敬
neo4j基本操作
心在了: 你好，请教一个问题，from neo4j import GraphDatabase driver = GraphDatabase.driver("bolt://192.168.122.253:7687", auth=("neo4j", "789456a123")) session = driver.session() results = session.run('''MATCH path1=(node1)<-[r1]-(node2), path2=(node1)<-[r2]-(node3), path3=(node1)<-[r3]-(node4), path4=(node3)<-[r4]-(node5), path5=(node3)<-[r5]-(node6) RETURN path1,path2,path3,path4,path5 LIMIT 100''') print(results.data()) session.close() print(results.data())，这代码为什么第一个打印有数据，session.close()之后就不能打印数据？？求帮忙

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。