word2vec

A52091

已于 2022-10-02 21:34:40 修改

阅读量605

点赞数

分类专栏： nlp 文章标签： word2vec 深度学习

于 2022-09-29 21:21:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A52091/article/details/127109416

版权

nlp 专栏收录该内容

1 篇文章 1 订阅

订阅专栏

词向量生成

1 one hot

根据字典中单词的个数构造向量，对于第i个单词其第i个维度的值为1，其余赋值为0，
one-hot的维度由词库的大小决定
缺点：
1所有向量的点积都为0，都是正交的，无法得出彼此之间的相似性，无法得出词与词之间的语义信息
2维度灾难
在这里插入图片描述

2 词的分布相似表示

核心思想：“你应该通过一个单词的同伴知道它的意思”
分布相似性是一种关于词汇语义的理论

word2vec

CBOW模型和Skip-gram模型
CBOW：由上下文词预测中心词
Skip-gram：由中心词预测上下文词
他们的区别结构仅仅是输入层和输出层的不同
如下：
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在理解各个模型的特点时要明白一个道理，词向量的生成不是模型训练的目的，而是建立每个词与上下文关系的过程中，不断训练，调参，调优得到的附带产物。最终实现最优化损失函数的时候得到的包含语义属性的词向量

softmax 与 sigmoid激活函数的区别，Softmax函数是二分类函数Sigmoid在多分类上的推广，目的是将多分类的结果以概率的形式展现出来，softmax函数所得的值的累积和是1，而sigmoid并没此要求。softmax函数要求输出答案互斥，比如分类结果要么是狗要么是猫，而sigmoid函数并不独占输出。当然它们各有各自的优缺点。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

A52091 CSDN认证博客专家 CSDN认证企业博客

码龄5年

24: 原创

31万+: 周排名

218万+: 总排名

12万+: 访问

: 等级

1094: 积分

30: 粉丝

215: 获赞

15: 评论

848: 收藏

私信

关注

热门文章

分类专栏

计算机核心 4篇
深度学习 1篇
nlp 1篇
Hadoop 1篇
java 1篇
zookeeper
python 7篇
数据库 3篇

最新评论

拒绝入坑之python 列表清空 list=[]和list.clear()的区别
闰土_RUNTU: 所谓”重新初始化列表达“达到清空列表的目的，只不过是将该变量名绑定给了另一个空列表，而不是清空原来的列表；原来的非空列表引用计数为0后会被回收。虽然达到的结果看似是一致的，但背后的原理不同。
数据库之关系数据库的关系运算
heure bleue: 因为原表没有abf
数据库之关系数据库的关系运算
Dosage de fleurs: 为什么除运算的（2）没有ab呀
计算机编制方式理解？按字编址和按字节编址？
开心生活没一天: 确实，我这这样想的按什么编址是cpu的视角，存储单元是多少是存储器的视角，两个没必然联系，不过这里感觉书上很多地方都很混乱所以这个地方很能迷惑人
计算机编制方式理解？按字编址和按字节编址？
调比较低: 关于MAR位数（CPU地址线数）和存储器地址线数：是的，你的理解是正确的。在某些情况下，存储器地址寄存器（MAR）的位数可能大于存储器的地址线数目。这通常发生在存储器是按字寻址的情况下，因为在这种情况下，一个存储单元的大小等于字长，而不是1个字节。在这种情况下，MAR的高位（也就是最重要的位）会被送到存储器的地址线上，而低位（也就是最不重要的位）则用于在一个字内部选择特定的字节。例如，如果存储器是32位的（即，一个存储单元包含4个字节），那么MAR的两个最低位就可以用于选择一个字内部的特定字节。总的来说，MAR的所有位并不都需要传到存储器的地址线上。在存储器是按字寻址的情况下，MAR的高位会被送到存储器的地址线上，而低位则用于在一个字内部选择特定的字节。。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。