NLP | 搜索引擎 python

完整代码:https://github.com/9ayhub/nlp-search-engine


题目

在这里插入图片描述


拼写检查

参考 http://norvig.com/spell-correct.htmlhttps://github.com/beyondacm/Autochecker4Chinese

倒排索引

参考 https://blog.csdn.net/xn4545945/article/details/8791484

文档排序

使用TF/IDF,参考课件

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结果

  1. 运行程序,开始初始化(建立倒排索引,计算单个词的tf-idf),用时大概4~6秒
    在这里插入图片描述

  2. 搜索【搜索】,耗时0.000000秒
    在这里插入图片描述

  3. 输入错别字,将自动纠正,搜索【本科专业】,耗时0.000998秒
    在这里插入图片描述

  4. 输入多个错别字,将自动纠正,搜索【杭州八大古都 人间天堂】,耗时0.000000秒
    在这里插入图片描述

  5. 输入带多个错别字的长句子,将自动纠正,本次搜索耗时0.000997秒
    在这里插入图片描述

展开阅读全文

没有更多推荐了,返回首页