自然语言处理 笔记一

自然语言处理 笔记

1.什么是自然语言处理?

NLP = NLU + NLG
NLU(Natural Language Understangding) 从语音/文本信息中 ------》 理解意思(meaning)
NLG(Natural Language Generation) 意思 ------》生成文本/语音

2.为什么NLP更难?

相比于 CV(Computer Vision),CV是所见即所得,是直观上感知;而NLP更为复杂,牵扯到上下文理解,词的多义性等等

3.NLP的Challenge

  • One Meaning —> Multiple Ways to Express(一种意思 多种表达方式)

在这里插入图片描述

- Ambiguity(一词多义)
在这里插入图片描述

4.怎么解决一词多义呢?

从词语的上下文进行分析,从数据出发
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

5. case study: 机器翻译

根据以往的翻译,翻译出指定的句子?
在这里插入图片描述

  • 解决方法:1.将原始数据翻译制作语料库,每个单词对应的翻译做成一一映射 2.查询将要翻译的单词,找到对应的翻译,连到一起
  • 解决方法的缺点:1.慢 2.没有考虑上下文 3.语义方面翻译不对 4.语法不对

那么该怎么做呢?
在这里插入图片描述
上面机器翻译的过程是怎样的呢?

  • 首先将 今晚的课程有意思 进行分词处理, 得到 今晚 | 的 | 课程 | 有意思
  • 逐词翻译 Tonight, of, the course, interesting
  • 由于逐次翻译没有语法概念,翻译后的词排列组合
  • Tonight, of, the course, interesting
    of, tonight, the course, interesting
    the course,…

    总共是4!=24种排列组合
  • 这些组合将会通过一个语言选择模型进行选择,语言选择模型会对每个组合进行概率估计,最终选择概率最大的句子

当逐词翻译出的句子排列组合较多时,语言选择模型的时间复杂度将会是指数级别的,是及不可取的。于是便产生了Viterb algorithm
在这里插入图片描述

  • 维特比同时考虑Translation Model和Language Model
    在这里插入图片描述
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值