NLP学习之word2Vec

最新推荐文章于 2024-08-24 10:02:25 发布

栽坑了

最新推荐文章于 2024-08-24 10:02:25 发布

阅读量761

点赞数 5

分类专栏： NLP 文章标签：自然语言处理学习 word2vec

本文链接：https://blog.csdn.net/AC_6011/article/details/141432210

版权

NLP 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本人的专注和兴趣方向实际上与ai基本无关（由于神经网络的可解释性对我来说太差了，所以一直觉得这个方向让我缺乏成就感），但是不知道为什么每次实现，面试的时候都觉得岗位应该和ai关系不大，但是每次做着做着总会发现逃不过，所以这次正好有整段的时间，稍微学习了一下。
我现在主要是在做一个文档处理的工作，想把一部分文档作为私域知识库，开发一个ai的qa和阅读理解服务。我觉得这篇笔记基本算是基础（因为我的ai真的约等于没有学）。
这篇文章是一些NLP的入门内容，重点放在了Word2Vec
好了，接下来进入正文：

NLP(自然语言处理)

（13年之前是统计学，13年之后随着深度学习的发展，NLP的研究也逐渐转向了深度学习，靠神经网络来解决NLP的问题）

一些学习资料

课程：

https://space.bilibili.com/365093772/channel/collectiondetail?sid=550238 NLP系列
https://blog.csdn.net/v_JULY_v/article/details/102708459 Word2Vec

数学书：程序员的数学书

笔记：

https://github.com/zibuyu/research_tao NLP研究入门之道
https://zhuanlan.zhihu.com/p/59184256 初入NLP领域的一些小建议
https://github.com/graykode/nlp-tutorial 100行内代码完成NLP任务

基本方法

递归神经网络（RNN，LSTM）

应该是一个token一个token的处理，而不是整个句子的处理。
比如处理一个句子的流程是：输入一个token，输出一个结果，然后输入下一个token，输出下一个结果，直到输入完整个句子。
主要有三个部分：输入层，隐藏层，输出层。

输入层：输入的是一个token，比如一个单词，一个字母等。
隐藏层：隐藏层的作用是将输入的token转换为一个向量，这个向量是一个固定长度的向量，这个向量的长度是可以调整的。
输出层：输出层的作用是将隐藏层的向量转换为一个结果，比如一个单词，一个字母等。
缺点：RNN的缺点是不能解决长期依赖的问题。（因为RNN的隐藏层的向量是一个固定长度的向量）