自然语言处理(NLP)入门(1)——前言

什么是NLP?

​ 自然语言处理(Natural Language Processing, 简称NLP), 是计算机科学与语言学中关注于计算机与人类语言间转换的领域, 简单来说就是让计算机识别并理解我们人类的语言,帮助我们完成一些类似翻译、问答等任务,NLP解决文本任务但并不限于文本,语音识别、看图说话等领域也属于NLP任务。

​ 计算机科学之父图灵在1950年发表的论文中提出“Can machines thinking?”这一划时代的问题,从此促成了人类语言与计算机科学的交融。在1957~1970年间,NLP领域开始形成两大阵营:基于规则和基于统计,直到1994~1999年,基于统计的方法逐渐取得胜利,概率计算开始引入到NLP领域的每个任务中。在2015年之前,NLP的解决方案都来源于机器学习,而2015年到至今,深度学习技术深刻改变NLP的未来。

NLP 常见任务

场景:设想你现在拿到一张英语试卷,会有哪些题目呢?

  • 判断题:对应NLP任务中分类任务,如情感分析等
  • 完形填空:对应NLP任务中的MLM任务
  • 排序:预训练语句顺序打乱, 排序
  • 阅读理解:对应NLP任务中阅读理解
  • 翻译: 对应NLP任务中的机器翻译
  • 写作:对应NLP任务中的文本生成

NLP解决上述任务的流程:数据获取 -> 文本预处理 ->模型构建 ->模型训练和评估 -> 模型测试 ->模型保存

其中重点内容就是文本预处理和模型构建的过程,文本预处理的程度决定了数据的优质程度,数据越好,越能达到预期,同样模型就类似人的大脑,越聪明,学习的越快,对数据的理解越深刻。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值