1.自然语言的发展过程可粗略地分为兴起、符号主义、连接主义和深度学习四个阶段,是十分曲折的,随着深度学习的提出和互联网发展,自然语言处理领域进入了深度学习时代
2.自然语言技术的发展在计算角度存在局限,计算机是计算的机器,只能将词组合成二进制代码存入到计算机中,但词的组合人类可以轻易联想,但计算机对字符串的加减乘除却无法得出
3.计算机在语言方面理解语言是当今自然语言处理的一大难题,计算机对自然语言对同义词,情感等问题难以理解
4.自然语言处理方法也在考虑处理社会问题:包括自然语言处理模型中的偏见和歧视、大规模计算对环境和气候带来的影响、传统工作被取代后,人的失业和再就业问题等。
5.当代自然语言处理任务包括:
- 词和短语级任务:包括切词、词性标注、命名实体识别、同义词计算等以词为研究对象的任务。
- 句子和段落级任务:包括文本倾向性分析、文本相似度计算等以句子为研究对象的任务。
- 对话和篇章级任务:包括机器阅读理解、对话系统等复杂的自然语言处理系统等。
- 自然语言生成:如机器翻译、机器写作等自然语言生成任务。