Subword Models

最新推荐文章于 2024-09-27 10:56:58 发布

Happyeveryyday

最新推荐文章于 2024-09-27 10:56:58 发布

阅读量216

点赞数

分类专栏： nlp综述文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/Happyeveryyday/article/details/107050758

版权

nlp综述专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.人类语言的声音

语音学是音流，这是属于物理层面的东西

词法学：一个n-grams的代替方案

在基于单词的模型中存在一些问题：
需要处理很大的词汇表，在英语中单词只要变个形态就是另一个单词了，比如说：gooooood bye

2.字符级别模型

单词嵌入可以由字符嵌入表示：

能为不知道的单词生成嵌入
相似的拼写有相似的嵌入
解决了oov问题
传统来说，一个因素或者一个字母不是一个因素单元，但是深度语言模型把它们组合在一起了。
单词之下的书写系统
大部分深度学习的任务都是从语言的书写形式来处理语言的，这是一个简单的过程，需要寻找数据。
纯字符级模型
在上一堂课的句子分类中，我们看到了一个纯字符级模型的好例子：
用于文本分类的超深度卷积网络
Conneau，Schwenk，Lecun和Barrault EACL 2017

通过深度卷积堆栈获得强大结果
纯字符级NMT模型
luong和Manining测试了一个纯字符级的seq2seq（LSTM）NMT系统作为baseline，它和基于word level的模型一样运行的很好，但是在训练时非常耗费时间。下图来是该系统的BLEU评分：
在这里插入图片描述
无需显式细分的全字符级神经机器翻译