1.Efficient Estimation of Word Representations in Vector Space

在这里插入图片描述

一,语言模型

【定义】:预测每个句子在语言中出现的概率(预测句子在语言中的概率,合法的句子概率较高)

  • 仅仅是对句子出现的概率进行建模,并不会去理解句子的意思

【例子】:
在这里插入图片描述
【问题】:每计算一个句子在语言模型中的概率会将整个句子所有可能出现的概率进行乘积

  • 这样会导致参数过多和过于稀疏,因为一个长句子出现的特异性概率是很小的
  • 提出基于马尔科夫假设:
    在这里插入图片描述
    【n-gram】:
    在这里插入图片描述

二,词向量

【独热编码】:
在这里插入图片描述
【分布式表示】:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
【词向量训练】

  • 没有方法可以直接训练词向量,我们都是在训练语言模型的同时间接的获取到词向量

三,NNLM/神经网络语言模型

在这里插入图片描述
在这里插入图片描述

  • 利用前面三个词来预测第四个词是什么
    在这里插入图片描述

四,RNNLM/循环神经网络语言模型

在这里插入图片描述

  • 可以真正的利用所有前文信息来预测下一个词(前面的方法都是采用n大小的滑动窗口)

五,CBOW/连续词袋模型

在这里插入图片描述
在这里插入图片描述

六,Skip-gram/跳字模型

在这里插入图片描述

七,问题

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值