NLP基础学习（二）

最新推荐文章于 2024-10-05 08:47:41 发布

San.ferry.▣

最新推荐文章于 2024-10-05 08:47:41 发布

阅读量135

点赞数

文章标签：自然语言处理机器学习人工智能

本文链接：https://blog.csdn.net/yizhenxinliang/article/details/115342060

版权

NLP基础学习

论文一：NLP-baseline-word2vec
在这里插入图片描述
1、词的表示方法
ONE-hot表示形式
一个向量只有一个地方是1，其他全是0

通过共现次数先构造共现矩阵，但是此时如果词数过多，构造的共现矩阵就会过大，所以这个时候需要进行降维度。

SVD： 在这里插入图片描述
继续向下演进，本文采用word2vec的是分布式表示方法。
此时向量里的内容都是一个浮点数而不是0或者1，而这些数是通过训练而得到的。

每个词都表示成一个D维的向量，但是这个D远小于词表的大小V。
这时候可以通过余弦夹角来表示词与词之间的相似度。

发展历史：
在这里插入图片描述

本文的研究成果：

提出了新的模型结构
提出优化训练的方法，是的训练速度加快
给出训练代码word2vec，使得单机训练称为了可能
成果:训练的词向量，又快又好，并且能够在大规模语料上进行词向量的训练。

研究意义：
在这里插入图片描述
1、对词的相似度进行评判
2、对词对的类比进行评判
3、能够作为预训练的模型提升NLP任务

论文的泛读

在这里插入图片描述
介绍：

传统的NLP把词当成最小的单元处理，并且能够在大语料上得到很好的结果，其中一个例子就是N-grams模型
然而很多的自然语言处理任务只能提供小语料的，如语音识别、机器翻译，所以简单地扩大数据规模来提升简单模型的表现在这些任务中不再适用，所以我们必须寻找更加先进的模型。
分布式表示可以在大语料上训练得到很好的语言模型，并且能够超过N-grams模型，这是一个很好的可以作为改进的技术。

论文学习

Efficient Estimation of Word Representations in Vector Space
基于向量空间中词表示的有效估计

前期知识储备
在这里插入图片描述
学习目标

学习目标

语言模型的概念
概念：语言模型是计算一个句子是句子的概率的模型。
比如：
老师的课讲得真好！ 0.8 （语义+语法）
老师的课真的很一般！ 0.01 （老师的课不好不符合语义）
课的老师很真好的！ 0.0001（语义与语法都不符合）