NLP_NLP技术的演进史

最新推荐文章于 2024-07-13 16:36:54 发布

you_are_my_sunshine*

最新推荐文章于 2024-07-13 16:36:54 发布

阅读量750

点赞数 17

分类专栏： NLP 文章标签：自然语言处理人工智能

本文链接：https://blog.csdn.net/weixin_42504788/article/details/136002644

版权

NLP 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

本文概述了自然语言处理(NLP)的历史发展，从早期的基于规则方法到统计方法的转变，以及深度学习和大数据如何推动NLP技术进步，特别是大规模语言模型的应用和扩展其应用领域。

摘要由CSDN通过智能技术生成

文章目录

在这里插入图片描述

起源: NLP 的起源可以追溯到阿兰·图灵在20 世纪50年代提出的图灵测试。图灵测试的基本思想是，如果一个计算机程序能在自然语言对话中表现得像一个人，那么我们可以说它具有智能。从这里我们可以看出，AI最早的愿景与自然语言处理息息相关。NLP问题是AI从诞生之日起就亟须解决的主要问题。
基于规则:在随后的数十年中，人们尝试通过基于语法和语义规则的方法来解决NLP问题。然而，由于规则很多且十分复杂，这种方法无法涵盖所有的语言现象。基于规则的语言模型的简单示例如下图所示。
基于统计:1970年以后，以弗雷德里克·贾里尼克(Frederick Jelinek)为首的IBM 科学家们采用了基于统计的方法来解决语音识别的问题，终于把一个基于规则的问题转换成了一个数学问题，最终使NLP任务的准确率有了质的提升。至此，人们才纷纷意识到原来的方法可能是行不通的，采用统计的方法才是一条正确的道路。因此，人们基于统计定义了语言模型(Language Model,LM):语言模型是一种用于捕捉自然语言中词汇、短语和句子的概率分布的统计模型。简单来说，语言模型旨在估计给定文本序列出现的概率，以帮助理解语言的结构和生成新的文本。
深度学习和大数据驱动:在确定了以统计学方法作为解决NLP 问题的主要武器之后，随着计算能力的提升和深度学习技术的发展，大数据驱动的NLP技术已经成为主流。这种技术使用深度神经网络(Deep Neural Network,也就是深层神经网络)等技术来处理海量的自然语言数据，从而学习到语言的复杂结构和语义。目前的大型预训练语言模型，在很多NLP任务上的表现甚至已经超过人类，不仅可以应用于语音识别、文本分类等任务，还可以生成自然语言文本，如对话系统、机器翻译等。