C#开源搜索引擎

这篇博客介绍了作者自主研发的C#开源搜索引擎,能够实现单机400万网页的全文索引,并保证在50词以内检索的响应时间不超过20毫秒。提供了下载链接和联系信息,寻求专家的反馈和建议。
摘要由CSDN通过智能技术生成
C#开源搜索引擎,.net搜索引擎开源


开源:完全自主研发搜索引擎1.0源代码及说明,单机400万网页全文索引,任意50词以内的检索不超过 20毫秒



搜索引擎1.0源代码、相关说明、下载地址如下:

1、Bwsyq.Search.Demo
  进行检索,就是常说的搜索引擎网站。提供检索服务。
  目前实现了:按关键词进行检索,实现了动态摘要、关键词高亮显示、自动分页、每页显示条目可自定义(默认每页显示10条检索结果)
  未实现功能:相关搜索关键词条显示、按相关度进行排序、快照、网页标题、采集时间、网页URL、并行集群检索
  其中:快照、网页标题、采集时间、网页URL 可根据实际情况自行实现
  相关搜索关键词条显示、按相关度进行排序、并行集群检索 将在下一版提供
2、Bwsyq.Search.Index
  进行索引,就是常说的全文索引。
   
3、DemoDoc 目录中的 3500个txt文档是用来做索引测试的文档。测试的使用请放置在:D:\index\DemoDoc 也可根据实际情况在代码中修改  

4、index 目录中的.idx 文件是测试建立的索引文件。 测试的使用请放置在:D:\index\index 目录,也可根据事情情况修改配置文件
   
5、注意事项:
  A、目前索引存储路径是 D:\index\index\ 可在配置文件中根据实际情况对配置文件“App.config、Web.config”进行修改
  <KeyInfo Key="SEARCHIDX" Value="D:\index\index\"/>
  B、索引所需词库存储路径是 D:\index\ App_Data 可在配置文件中根据实际情况对配置文件“App.config”进行修改
  <KeyInfo Key="PhysicaPath" Value="D:\index\"/> 修改后将 App_Data文件夹及其中的文件全部拷贝到对应目录即可
  C、检索所需词库存存储路径是 网站项目中的 App_Data 目录,无须修改
  D、BwsyqIndex.dll 是核心库,采用C语言开发,可存放在system32目录,或项目运行的目录bin或release目录中。
   
6、目前提供的版本是2.0版,有如下性能指标:  
  A、单机可索引400万网页、
  B、普通PC: AMD 2.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值