05 神经网络语言模型(独热编码+词向量的起源)

40 篇文章 0 订阅
21 篇文章 1 订阅
本文介绍了神经网络语言模型,包括n元语言模型和使用神经网络进行预测。重点讲解了独热编码在计算机理解单词中的作用,以及词向量作为神经网络语言模型的副产品,如何用于表示和计算单词间的相似度。最后,提到了词向量在下游任务中的应用。
摘要由CSDN通过智能技术生成

统计语言模型

统计+语言模型–》用统计的方法去完成以下两个和人说的话相关的任务

语言模型 = 语言(人说的话) + 模型(去完成两个任务)

  1. 比较,“词性”,“磁性”
  2. 预测下一个单词(填空)

n 元语言模型

取 a(2,3,4) 个词

神经网络语言模型

神经网络+语言模型–》用神经网络的方法去完成以下两个和人说的话相关的任务。

第二个任务:

“判断”,“一个”,“词”,“的”,“___

假设词库里有“词性”和“火星”

P(__|“判断”,“一个”,“词”,“的”)

词性

img

w1,w2,w3,w4(上述 4 个单词的独热编码)

w1*Q=c1,
w2*Q=c2,
w3*Q=c3,
w4*Q=c4,

C=[c1,c2,c3,c4]
Q就是一个随机矩阵,是一个参数(可学习)

“判断”,“这个”,“词”,“的”,“词性”

softmax(U[tanh(WC+b1)]+b2)== [0.1, 0.1, 0.2, 0.2, 0.4] ∈ [ 1 , V L ] \in[1,V_L] [1,VL]

独热编码 (one-hot 编码)

独热编码:让计算机认识单词

img

词典 V(新华字典里面把所有词集合成一个集合 V)

假设词典里面只有 8 个单词

计算机不认识单词的

但是我们要计算机认识单词

“fruit”

独热编码:给出一个 8*8 的矩阵

“time” --》 10000000

“fruit” --》 01000000

“banana” --》 00000001

余弦相似度 去计算两者的相似度(0)–词向量(矩阵乘法)

词向量(神经网络语言模型的副产品 Q)

给我任何一个词,

“判断” --》 独热编码w1 [1,0,0,0,0]

w1*Q =c1 (“判断”这个词的词向量)

词向量:就是用一个向量来表示一个单词

可以控制词向量的维度(大小)

如果我们得到的词向量,第一个问题也被解决了,(下游任务)

总结

神经网络语言模型:通过神经网络解决两个人说的话的问题

有一个副产品:Q 矩阵–》新的词向量(词向量可以选择词向量的维度,可以求两个词之间的相似程度)

下游任务

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值