NLP--绪论（概念，发展，研究内容，方法）

最新推荐文章于 2023-03-12 19:43:28 发布

又又2020

最新推荐文章于 2023-03-12 19:43:28 发布

阅读量690

点赞数

文章标签： nlp

本文链接：https://blog.csdn.net/qq_41939332/article/details/104466668

版权

自然语言处理（Natural Language Processing):用计算机可计算的方法对自然语言的各级语言单位（字、词、语句、篇章等）进行转换、传输、存贮、分析等加工处理的理论和方法。
语言：人类所特有的用来表达意思、交流思想的工具，是一种特殊的社会现象。三种类型：孤立语、曲折语、黏着语
自然语言是指人类日常使用的语言，如汉语、英语、法语、德语，等等。
处理：对信息的接收、存储、转化、传送和发布等操作。
语言处理的两个层次：
一字符处理（输入、存储、输出）
一内容处理（词语切分，词性标注，结构分析，意义理解，推理，翻译…等等）

按照应用目标划分，包括：

机器翻译（Machine translation,MT）
实现一种语言和另一种语言的自动翻译
应用：文献翻译、网页浏览辅助等
信息检索（Infomation retrival）
信息检索也称情报检索，就是利用计算机系统从大量文档中找到符合用户需要的相关信息。
自动文摘（Automatic summarization/abstracting）
将原文档的主要内容或某方面的信息自动提取出来，并形成原文档的摘要或缩写
问答系统（Question-answering system）
将计算机系统对人提出的问题的理解，利用自动推理等手段，在有关知识资源中自动求解答案并做出相应的回答。
信息过滤（Information filtering）
通过计算机系统自动识别和过滤满足特定条件的文档信息。
信息抽取（Information extraction）
从指定文档中或海量文本中抽取出用户感兴趣的信息。
文档分类（Document categorization）
文本自动分类或信息分类，其目的就是利用计算机系统对大量的文档按照一定的分类标准实现自动归类。
语言识别（automatic speech recognition,ASR）
将输入语音信号自动转换成书面文字
文语转换/语音合成（text-to-speech synthesis）
将文本自动转换成对应的语音表征