搜索引擎应该包括的重要功能

看了许久的JAVA后,开始开始看老师规定的书了。决定好好了解搜索引擎以及JAVA中的搜索引擎框架lucene。

总的来说,搜索引擎包括这些方面:

网页的抓取,这就主要用spider,可以用广度优先或深度优先进行网页搜集。而搜集可以分为增量搜集和定期搜集,我们著名的GOOGLE就是28天定期搜集一次。

而后,就是对信息进行预处理。包括关键词的提取、重复和转载的消除、链接分析以及网页重要程度的计算。

最后,就是提供查询服务了。包括查询方式及匹配、网页排序和文档摘要。

搜索引擎是个庞大的项目,每一个小的部分都很值得研究。恩,努力面对挑战。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值