搭建搜索引擎初试小刀

这几天准备考虑搭建一个搜索引擎,于是从0开始学习搜索方面的内容,还好,有很多开源的项目可以参考使用,除了学习参照,很多的可以直接拿过来用,真是感谢伟大的开源。 Heritrix是一个开箱即用的爬虫(web crawl), 可以针对站点进行深度拷贝,而且带有一个WebUI, 允许...
阅读(743) 评论(0)
    个人资料
    • 访问:1686716次
    • 积分:14182
    • 等级:
    • 排名:第908名
    • 原创:353篇
    • 转载:48篇
    • 译文:0篇
    • 评论:262条
    SearchEngin