1 自然语言处理的研究内容
- 机器翻译和问答系统
- 自动文摘和文档分类
- 文字编辑和自动校对
- 语音识别和语音合成
2 机器翻译和问答系统
2.1 机器翻译
- 机器翻译(Machine Translation,MT):实现一种语言到另一种语言到自动翻译。
- 应用:文献翻译、网页辅助浏览器等.
- 代表系统:Google、百度、有道翻译等.
机器翻译的前景非常广阔,包括文化、商贸、旅游等。
2.2 问答系统
- 通过计算机系统对人提出的问题的理解,利用自动推理等手段,在有关知识资源中自动搜索答案并作出相应的回答。
- 社区问答、智能客服、IBM Watson等
3 自动文摘和文档分类
3.1 自动文摘
- 将原文档的主要内容或某方面的信息自动提取出来,并形成原文档的摘要或者缩写.
- 应用:观点挖掘、电子图书管理、情报获取.
3.2 文档分类
- 文档分类也叫文本自动分类或信息分类,其目的是利用计算机系统对大量的文档按照一定的分类标准(例如,根据主题或内容划分等)实现自动归类。
3.3 情感分析
- 简单的说,情感分析任务可以定义成一个分类问题。
- ——输入:给定一个自然语言的句子。
- ——输出:输出这个句子的情感分类,如高兴、普通、惊讶、伤心、愤怒。
4 文字编辑和自动校对
- 对文字拼写、用词、甚至语法、文档格式等进行自动检查、校对和编排。
- 应用:排版、印刷和书籍编撰等。
5 语音识别和语音合成
5.1 语音识别
- 将输入语音信号自动转换成书面文字。
- 应用:文字录入、人机通许、语音翻译等等。
- 困难:大量存在的同音词、近音词、口音等等。
5.9 语音合成
- 困难:大量存在的同音词、近音词、口音等等。将书面文本自动转换成对应的语音表征。
- 应用:朗读系统、人机语音接口等等。