自然语言处理-003NLP定义以及歧义性-学习笔记

自然语言处理的难点:

 

1. the challenge:multiple ways to express,对于同一个意思有多种表达方式

2. the challenge:Ambiguity,一词多义,一个词在不同语境中表达的含义

how to solve ambiguity?

例: interest,没有任何语境下,按照三个意思的主观统计概率进行意思归类

a financial interest in IBM (有语境的条件下),有data输入->更新主管概率(认知),要考虑上下文处理,NLP context

Case Study:Machine Translation

机器翻译系统:

通过12对的翻译对,将未知句子进行翻译

1. 针对单个单词进行翻译,找到

问题点:

1. 慢(AI与模型,算法优化)

2. 语义的问题无法解决

3. 没考虑上下文

4. 语法不对,前后顺序问题

5. 规则统计

LM为Language Model,语言模型

翻译系统的实现思想分成两个步骤:

1. 中文分词后进行单个单词的翻译——翻译模型p(c|e)

2. 将翻译好的单词进行排列组合,通过语言模型选择最佳的组合作为翻译的结果——语言模型p(e)

缺点:

1. 计算量非常大,如果是一篇文章有100个单词 100!

复杂度较高

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值