接触NLP以来,走过的坑颇多,回头望,满是心酸泪啊。鉴于此,为了让更多的人少走弯路,我决定写下一系列教程,既是为了总结这段时间所学,也是为了服务大众。毕竟才疏学浅,还希望大家多多批评指教。
暂定每周更新一篇TEACH_NLP博文,希望能让后来人能够尽快的走入NLP的大门。目前我的研究方向是情感分类,方法是深度学习(LSTM,CNN。。。),工具以tensorflow为主,语料库以英文语料库为主,因此,切入点就从情感分类开始。我将从数据处理开始,到建模到训练,到模型优化,到调参……简化理论,重视应用,一步一步讲解NLP相关知识。暂列大体框架如下:
1、Tonsorflow简单入门——简单全连接神经网络实现
2、文本数据处理——从原始数据处理成神经网络需要的形式
3、第一个神经网络模型——全连接神经网络进行情感分类
4、简单LSTM模型——LSTM进行情感分类
5、Multi-LSTM(多层LSTM),Bi-LSTM(双向LSTM)的实现
6、LSTM模型加词向量进行情感分类
7、Attention 机制在LSTM里的实现
8、CNN模型
9、Attention 机制在CNN里的实现
10、CNN与LSTM的串联及并联
11、正则化的使用,滑动平均,动态学习率等技巧的使用
12、调参技巧简单介绍
若有必要还会添加一些必要的或有趣的内容。比如诗歌生成,对话生成等方向的知识。希望能与大家一起学习一起进步。为保证教程质量,暂定一周更新一篇。
本教程相关完整代码均发布于:https://github.com/pkulics/teach_NLP
同时, 码世界也会同步更新本系列教程。