1. NLP的概念:
NLP是计算机科学领域以及人工智能领域的一个重要的研究方向,它研究用计算机来处理、理解以及运用人类语言(如中文、英文等),达到人与计算机的有效通讯。在人类社会中,语言扮演着一个重要的角色。在一般情况下,用户可能不熟悉机器语言,所以自然语言处理技术可以帮助这样的用户使用自然语言与机器交流。从建模的角度看,为了方便计算机处理,自然语言课一被定义为一组规则或符号的集合,我们组合集合中的符号传递各种信息。自然语言处理研究表示语言能力、语言应用的模型,通过建立计算机框架来实现这样的模型,并不断完善这些模型。NLP可以分为两个部分:自然语言处理以及自然语言生成,及理解和生成文本的技术。
语言理解涉及语言、语境和各种语言形式的学科,包括声音的音系学,代表构词法的词态学,代表语句结构的句法学,代表理解的语义句法学和语用学。而自然语言生成则是从结构化数据中以读取的方式自动生成文本。该过程主要包括三个阶段:文本规划(完成结构化数据中的基础内容规划)、语句规划(从结构化的数据中组合语句表达信息流)、实现(产生语法通顺的语句来表达文本)。
2. NLP的应用方向
NLP可以被用于很多领域,有以下一些通用的应用:机器翻译、情感分析、智能问答、文摘生成、文本分类、舆论分析、知识图谱。这些方面可以广泛应用于各种方面,如翻译软件应用机器翻译、评论网站应用情感分析、电商网站的机器客服应用智能问答、文摘生成对文献进行核心内容提取、文本分类用于过滤垃圾邮件、舆论分析可以控制舆论导向、知识图谱描述知识资源及其载体。
3、NLP的发展历程
NLP的发展历程大