关于对sql2000查询结果进行相关度排序的测试

   sql2000的查询结果进行相关度排序,听起来好象很吸引人,不过真的是可以实现的。
    上午上网看到了一篇利用微软index server来做全文查询的文章(这个以前也看到过,在计算机管理中也自带了这样一个查询功能)
我的IIS默认web服务器在g:/wwwroot下其中有10万多的html文档
   测试:strSearch = "SELECT DocTitle, Path, FileName, Characterization, Size,write,RANK" & _
" FROM SCOPE()" & _
" WHERE CONTAINS ('" & Request.Form("txtSearchFor") & "') ORDER BY RANK  desc" 还进行了相关度的排序,我没有做时间的具体开销
的计算,不过给人的感觉还可以接受,在翻页的时候就非常快了。不过最大的缺点好象就是只能索引静态页面了。
   下午我把以前的一个50多万条记录(主要是歌曲名和歌手名)的数据库在sql2000做了索引,晚上就可以开始测试了。
   测试一: "select top 26 * from song1 where contains(songtitle,'爱')",对结果没有进行任何的处理,只是按照ID的升续排列
时间开销基本上维持在0.016s,速度是很让人满意的,至少感觉不到慢。

   测试二:利用rank值进行了相关度的排序,"order by rank desc" or "order by rank asc",查询结果在排序的质量上让人满意,都比较
准确的,不管是查询时使用 or 或者and进行多关键字的排序都还可以的,不过时间的开销让我受不了,居然在6s到8s之间,
而且cpu也占用比较高
   我看到网上其他的搜索的相关度排序都比较快的,开源的Lucene我没有研究过,因为我不懂java。
不过我想如果在索引的时候对每个关键字进行相关度的运算查询起来应该不会慢的啊,这个我也感到郁闷。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值