NLP-简单问答系统实现及优化

目录

一、读取文件

二、数据统计

三、文本预处理

四、问题转为向量

五、 计算并输出结果

六、倒排表优化

1.倒排表制作

 2.倒排表实现输出

七、词向量优化

1.词向量转换

 2.计算并输出


一、读取文件

主要是把问题和答案放到两个列表里,并且对应好索引。

 

二、数据统计

这里可以进行可视化,需要统计一下出现频率低的词,以备后面需要删除。

 

三、文本预处理

对问题列表进行预处理,包含符号去除、字母变小写、停止词、频率低的词、数字处理、提取词干等。

 

四、问题转为向量

五、 计算并输出结果

查看计算时间

 

六、倒排表优化

1.倒排表制作

 2.倒排表实现输出

 查看结果及计算时间

 

七、词向量优化

1.词向量转换

这里我使用100维的词向量,需要定义一个转换函数

 2.计算并输出

 查看结果及计算时间

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值