词嵌入(Word Embedding)

1.把词汇映射到数学空间的过程称为词嵌入

2.最简单的嵌入是one-hot,但很难表达相似度

3.通过分布式表示来表示词嵌入,word2vec是其中一种

4.word2vec有三个假设,一个窗口假设,两个独立同分布假设

5.最终优化的目标函数是对数最大似然函数

6.通常使用神经网络去优化目标函数,输出层与词汇量个数相同

7.word2vec模型共用相同的隐藏层和系数矩阵

8.用每个词汇的one-hot表示与系数矩阵相乘得到的d维矩阵作为词汇的分布式表示

词向量的表示

数学模型的输入都是数值型的符号,对于文字,比如英文或者中文,那么我们就需要对文字做处理,转化为数字,才可以输入数学模型里面做训练.这方面典型的应用就是NLP(自然语言处理)。

所以,要对文字建立模型,第一步就需要对文字做数值转化——即把文字形式嵌入到一个数学空间,我们把这个过程称为词嵌入(word embedding)。一个最简单的嵌入方法就是one-hot,比如性别取值【男、女】转换为【0,1】。

传送门:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

整得咔咔响

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值