NLP-问答系统流程

问答系统的流程如下:

①获取原始文本

②分词

③文本清洗,包含:

html标签、stop words(a,an,the等)、纠错、大小写转换等

③文本标准化,比如:

go, went, going, gone这一类词全部映射为go

④转为向量,方法:

boolean vector / count vector / tfidf / word2vec / seq2seq等

⑤建模,比如把库中的内容根据相似度排序然后返回结果

后面的学习笔记会对以上内容逐一探索。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值