【nlp】1.2文本张量表示方法(词向量word2seq和词嵌入Word Embedding)

本文介绍了文本张量表示方法,重点讲解了一种常用的词向量表示方法——one-hot编码及其优劣势,并深入探讨了word2vec模型,包括CBOW和skipgram模式的工作原理,以及词向量的训练和效果检验。同时,提到了词嵌入在自然语言处理中的重要性。
摘要由CSDN通过智能技术生成

将一段文本使用张量进行表示,其中一般将词汇表示成向量,称作词向量,再由各个词向量按顺序组成矩阵形成文本表示。作用:方便输入到计算机中

举个例子:

["人生”,“该”,"如何",“起头"]

==>

#每个词对应矩阵中的一个向量
[[1.32,4,32,8,32,5.2],
[3.1,5.43,8.34,3.2],
[3.21,5.32,2,4.32],
[2.54,7.32,5.12,9.54]]

如果不理解文本张量的意思,可以参考如下(先理解数值化,就是对词进行编号,再理解张量化,就是使用多维来表示这个词,对比一个人的成绩,可以使用五个学科成绩,即五维表示)
在这里插入图片描述

1 one-hot词向量表示

又称独热编码,将每个词表示成具有n个元素的向量,这个词向量中只有一个元素是1࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值