词嵌入矩阵(Word Embeddings)的生成

最新推荐文章于 2024-05-23 19:34:11 发布

一声叹惋

最新推荐文章于 2024-05-23 19:34:11 发布

阅读量2.1k

点赞数 2

分类专栏： NLP 文章标签：词嵌入矩阵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41817836/article/details/102557081

版权

NLP 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

词嵌入矩阵的学习

词嵌入
- 格式
- 词嵌入矩阵的训练

词嵌入

词嵌入矩阵是自然语言处理里非常重要的东西。它可以帮助我们快速的使用小样本建立一个不错的自然语言处理任务。那么他是如何生成的呢。

格式

词嵌入矩阵一般在一个很大的字库里学习的，其中包含许多的单词，格式为[keyword_num,vec_num]。
keyword_num就是训练字库的字的数量（英文为一个单词或一个字母）；
vec_num代表了用多少维的向量表示字库里的一个字。

输入的数据为一句话，格式为[m,maxLen]
m为输入样本数；
maxLen为句子的最大长度，不够用0补全。
每个maxLen为一个单词在字库里的编号，我们知道一个单词可以表示为一个one_hot向量，只有一个位置为1，其他为0。此处为这个位置的索引。
每个这样的one_hot向量与词嵌入矩阵相乘得到最后的网络输入，维度为[m,maxLen,vec_num]。

词嵌入矩阵的训练

现在一般使用其他人训练好的词嵌入矩阵，很多人已经使用庞大的字库对词嵌入矩阵进行训练。而且网上已经有大量的开源词嵌入矩阵的训练结果。
词嵌入矩阵的训练方法为，使用Word2Vec,负样本，Skip-Gram,Glove等。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
词嵌入矩阵(Word Embeddings)的生成

词嵌入矩阵的学习词嵌入格式词嵌入矩阵的训练合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入词嵌入词嵌入矩阵是自然语言处理里非常...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。