阿里云人工智能工程师ACP认证考试知识点辅助阅读
(Aliyun AI ACP 09)自然语言处理基础知识
NLP基本概念与历史
自然语言处理(NLP)是一种跨学科的研究领域,它将计算机科学、人工智能、认知科学以及语言学等多个领域的知识相结合,以解决人与计算机之间的自然语言交互问题。NLP的主要目标是使计算机能够理解、生成和操纵人类使用的自然语言,涵盖书面和口头形式。
历史上,NLP经历了三个主要发展阶段:
-
规则驱动阶段:
在早期,NLP主要依赖于专家编写的语言规则和词法规则,如CFG(上下文无关文法)和有限状态机(FSM),用于执行诸如词性标注、句法分析等任务。这种方法虽然在特定情境下表现良好,但难以应对语言表达的丰富多样性及变化性。 -
统计方法阶段:
随着大规模语料库的建立和计算机计算能力的增长,统计学习方法在NLP领域开始占据主导地位。例如,隐马尔可夫模型(HMM)成功应用于词性标注和语音识别,条件随机场(CRF)在序列标注任务上表现出色,而最大熵模型、朴素