自然语言处理笔记一

最新推荐文章于 2023-12-07 14:17:07 发布

yzhua_777

最新推荐文章于 2023-12-07 14:17:07 发布

阅读量384

点赞数 1

分类专栏：自然语言处理文章标签：自然语言处理人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yzhua_777/article/details/127276761

版权

自然语言处理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

自然语言处理笔记

1.什么是自然语言处理？

NLP = NLU + NLG
NLU(Natural Language Understangding) 从语音/文本信息中 ------》理解意思(meaning)
NLG(Natural Language Generation) 意思 ------》生成文本/语音

2.为什么NLP更难？

相比于 CV(Computer Vision),CV是所见即所得，是直观上感知；而NLP更为复杂，牵扯到上下文理解，词的多义性等等

3.NLP的Challenge

One Meaning —> Multiple Ways to Express(一种意思多种表达方式)

在这里插入图片描述

- Ambiguity(一词多义)
在这里插入图片描述

4.怎么解决一词多义呢？

从词语的上下文进行分析，从数据出发
在这里插入图片描述

在这里插入图片描述

5. case study: 机器翻译

根据以往的翻译，翻译出指定的句子？
在这里插入图片描述

解决方法：1.将原始数据翻译制作语料库，每个单词对应的翻译做成一一映射 2.查询将要翻译的单词，找到对应的翻译，连到一起
解决方法的缺点：1.慢 2.没有考虑上下文 3.语义方面翻译不对 4.语法不对

那么该怎么做呢？
在这里插入图片描述
上面机器翻译的过程是怎样的呢？

首先将 今晚的课程有意思 进行分词处理，得到 今晚 | 的 | 课程 | 有意思
逐词翻译 Tonight, of, the course, interesting
由于逐次翻译没有语法概念，翻译后的词排列组合
Tonight, of, the course, interesting
of, tonight, the course, interesting
the course,…
…
总共是4!=24种排列组合
这些组合将会通过一个语言选择模型进行选择，语言选择模型会对每个组合进行概率估计，最终选择概率最大的句子

当逐词翻译出的句子排列组合较多时，语言选择模型的时间复杂度将会是指数级别的，是及不可取的。于是便产生了Viterb algorithm
在这里插入图片描述

维特比同时考虑Translation Model和Language Model

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
自然语言处理笔记一

自然语言处理笔记一
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。