一、   JZSearch精准搜索引擎简介

JZSearch精准搜索引擎是灵玖中科软件(北京)有限公司专门针对行业细分搜索的需求而打造的一款互联网产品,它能够依据行业用户的细分特点,方便快捷地构建精、准、快的搜索服务。

 

JZSearch精准搜索引擎的特色在于:

²    更加精准专业的网站搜索范围;

²    更加贴近行业需求的语义知识库,比如专业术语;

²    更加方便快捷的搜索配置:提供网站列表和关键词即可;

²    无需任何技术、服务器、运维的投入,只需要经营

JZSearch精准搜索引擎采用了灵玖软件在自然语言理解、信息检索方面的先进技术成果,融合多年在信息发现整合方面的工作积累,是当前互联网精准搜索的一大利器。

二、   JZSearch精准搜索引擎功能介绍

JZSearch精准搜索引擎具备:精准的信息采集、高效的实时分析、并行的信息索引、分布式的信息检索、方便的日志和维护等功能。

2.1 精准的信息采集

JZSearch精准搜索引擎当前内置了多个行业的细分网站和专业词汇,基本覆盖了行业内绝大部分的网络空间;同时,JZSearch可以便利地添加任何需要检测的网站,只需要配置网站入口,剩下的事情全部由JZSearch自动实现。

JZSearch采集系统能够在网站和专业词汇的指导下,进行信息的精确采集。目前已经积累了上百万的信息资料,同时每天采集的各类信息数十万条。在采集服务器和带宽允许的情况下,信息延迟不超过3个小时。

2.2 专业化的信息搜索

精准搜索的特色在于:

       1、支持无词典索引,支持搜索维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言;

       当前的搜索大部分都需要内置一部核心词库,而维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言往往缺乏相关的电子资源,整理一部词典往往费时费力。JZSearch全文精准搜索引擎支持词典与无词典两种模式,无词典时,采用N-Gram模型,同样可以构建高速的索引与搜索。

2、支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索;

3、内置多种检索模型,支持多种排序策略,包括相关度、时序等;

4、全文索引压缩比约为1/4,大大减少了索引的开销,提高了所有效率;

5、支持丰富的查询语法,支持与、或、非以及邻近运算;

6、可扩展性强:支持数据库的全文搜索,以及word, ppt, pdf, email等各种文档格式的搜索;可以便利地构建各类网络搜索引擎服务。

JZSearch中输入搜索词,返回的结果都是跟专业领域密切相关的信息。

2.3 方便的运营维护

JZSearch需要转变行业或专业领域时,只需要在配置页面中简单的更换网站列表和关键词汇,就可以快速的实现信息类型的转换。

JZSearch采用全自动的运行控制机制,系统一经启动,无须过多的运行管理,最大化的减轻运营负担。

三、   JZSearch精准搜索引擎性能环境

3.1 性能指标

本系统的性能主要由单机采集器的性能和需要处理的信息量决定。

 

单台采集器性能:

l        采集网站数:1000

l        每秒采集页面数:50

l        平均占用带宽:1M2M

索引和分析服务器

l        分词平均速度:20MB/s

l        索引平均速度:10MB/s

l        最大处理信息量:1TB