一、基本概念
- 自然语言处理(Natural Language Processing):用计算机可计算的方法对自然语言的各级语言单位(字、词、语句、篇章等)进行转换、传输、存贮、分析等加工处理的理论和方法。
- 语言:人类所特有的用来表达意思、交流思想的工具,是一种特殊的社会现象。三种类型:孤立语、曲折语、黏着语
- 自然语言是指人类日常使用的语言,如汉语、英语、法语、德语,等等。
- 处理:对信息的接收、存储、转化、传送和发布等操作。
- 语言处理的两个层次:
一 字符处理(输入、存储、输出)
一 内容处理(词语切分,词性标注,结构分析,意义理解,推理,翻译…等等)
二、NLP的发展历程
- 20世纪50年代起步
- 60年代中期以前:萌芽期
- 60年代后期至70年代中后期:衰落
1966年美国科学院发表ALPAC报告 - 70年代中后期至80年代后期:复苏
- 80年代后期至今:蓬勃发展
- 统计方法占据主流
- 大规模语料可用,计算机性能大幅提高
- 互联网的迅速发展为NLP提供了实验数据来源和新的应用场景
三、NLP研究内容
按照应用目标划分,包括:
<

最低0.47元/天 解锁文章
331

被折叠的 条评论
为什么被折叠?



