自然语言处理基础内容之一

图灵测试(模仿的像一个人)  图灵游戏

自然语言处理

Watson

QA system

Advances in natural language processing

自然语言处理基础(词表示与语言模型)

问本(词语)

利用这个词的上下文来表示这个词,准确的来说利用这个词附近关键词的数量来判断相似度,但缺点也非常明显,随着词汇量的增大,表的内容也开始变得越来越大,另一点是出现少的一些词语的表示会变得没有想象的这么好,然而,大模型和深度学习利用分布式来解决这个问题,低维度的向量来表示,例如首都和国家的关系

语言模型

根据前文来预测下一个词(计算机)

计算词语成为序列的概率

设想:后面的词只会受到前面的词的影响

去统计前几个词出现下一个词语的概率,根据概率来预测 N-gram模型 计算间隔几个词时,几个词和一个词的概率是多少

缺点:量太大了n大的话计算量爆炸式增长,对近义词的检测不强例如,she is beautiful和he is handsome在这个模型是毫无关系的,而对于人来说,这两句话是非常相近的

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值