NLP相关知识汇总（持续更新）

最新推荐文章于 2023-05-15 09:40:52 发布

zsdt345a780rfajwet

最新推荐文章于 2023-05-15 09:40:52 发布

阅读量591

点赞数

分类专栏：机器学习 NLP 文章标签： NLP 深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zsdt345a780rfajwet/article/details/90748923

版权

机器学习同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

基础知识点

作为一个半路出家搞NLP的人，知识系统实在是不系统，不完整，只能用到什么查什么，姑且先这么记录一下学习历史吧。为了避免版权问题，都只给链接，希望原链接不要失效吧。

一、数据处理

1. one hot 编码

2. word embedding

Word Embedding的发展和原理简介

3. word2vec

4. 句法分析

constituent parsing & dependency parsing

二、网络层

1. MLP

2. CNN

3. RNN

变种LSTM，GRU等

三、数据增广

1. Active learning

在已有初步模型基础上，有效选择需要标注的数据，让标注效果最大化

【Active Learning - 01】深入学习“主动学习”：如何显著地减少标注代价

四、tricks

Dropout

深度学习中Dropout原理解析

Attention

论文：Neural Machine Translation by Jointly Learning to Align and Translate
哈佛大学 NLP 研究组写的，代码原理双管齐下：The Annotated Transformer，译文

Batch-Normalization

【AI数学】Batch-Normalization详细解析

Layer-Normalization

【AI数学】Layer-Normalization详细解析

五、主要相关领域

序列标注

CRF

原理介绍，解析易懂：简明条件随机场CRF介绍（附带纯Keras实现）
CRF层在BiLSTM上的应用，英文，举例说明：CRF Layer on the Top of BiLSTM

六、新技术

Transformer

论文原文：Attention Is All You Need
一文读懂「Attention is All You Need」| 附代码实现
BERT大火却不懂Transformer？读这一篇就够了通过举例说明，形象
详解Transformer （Attention Is All You Need）和上文可协同理解

BERT

2018年10月底公布了BERT（Bidirectional Encoder Representation from Transformers) 在11项nlp任务中的卓越表现

论文原文：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
论文译文：2018年最强自然语言模型 Google BERT 论文全文中译
【NLP】彻底搞懂BERT (和arxiv的版本略有不同，大致内容相同)

XLNet

论文原文：XLNet: Generalized Autoregressive Pretraining for Language Understanding

七、经典论文

A Neural Probabilistic Language Model》
- 说明无监督的数据可以用来作为语言模型的训练数据
- 【论文阅读】A Neural Probabilistic Language Model
Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks
- 将神经元经过特定排序是为了将层级结构（树结构）整合到LSTM中去，从而允许LSTM能自动学习到层级结构信息。
- ON-LSTM：用有序神经元表达层次结构

zsdt345a780rfajwet

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
NLP相关知识汇总（持续更新）

基础知识点作为一个半路出家搞NLP的人，知识系统实在是不系统，不完整，只能用到什么查什么，姑且先这么记录一下学习历史吧。为了避免版权问题，都只给链接，希望原链接不要失效吧。❀数据处理one hot 编码什么是one hot编码？为什么要使用one hot编码？机器学习：数据预处理之独热编码（One-Hot）word embeddingWord Embedding的发展和原理简介...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。