建立词到文档的快速查找

第一步:对关键字进行分词
分词-分词程序-mmseg(根据某个词频匹配);
eg:
  输入内容:中华人民共和国
  词库:
      中华:50
      中华人民:100
      共和:100
      国:20
   分词结果:中华人民
             共和
             国
   均建立从这些词到该文档的索引
 第二步:建立分词结果到文档的索引

建立关键词到文档的索引;

第三部:对结果集进行排序

根据attr(类别属性)过滤结果集
命中结果集根据某个attr进行排序
在文档上可以设置每个区域的不同权重
搜索引擎:sphinx
阅读更多
文章标签: 文档 搜索引擎
上一篇Linux 下 MySQL 启动与关闭 说明
下一篇secureCRT 配置和使用(vm上安装的ubuntu)
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭