NLP基础学习
首先我们先弄清楚为什么要学自然语言处理,我们的目的就是从大规模文本数据中提取信息,有以下几个场景
- 机器阅读理解
- 信息抽取
- 舆情分析
- 文本分类
同时我们需要清楚为什么学习自然语言处理要阅读大量论文
- 技术发展日新月异,通过读论文可以获得最前沿的技术
- 论文可以获取一手的知识
- 熟读唐诗三百首,不会作诗也会吟
- 复现论文也可以提高编程技术:算法工程师:理论水平+工程能力
发展方向: - ONE-HOT向分布式表示的发展(从一维到多维的发展)
- 机器学习向深度学习发展(自动提取特征)
- 大粒度向小粒度发展(单词仅有一个字母拼错,对于大粒度就是一个全新向量,但是对于小粒度还是可以很好的识别)
- 简单任务向复杂任务发展(起初只有文本分类,现在例如神经机器翻译、多类别文本分类等)
比较好的会议:
ACL CCF-A
EMNLP CCF-B
NAACL CCF-C