爬虫书籍

1,网络机器人Java编程指南,浅显易懂,有点过时,但适合新手

2,自己动手写网络爬虫,有点基础还可以看看,写的有点乱,很多内容交代不清楚,并且大篇幅代码抄袭。。。

3,搜索引擎 ——原理、技术与系统,北大天网为案例,很好很强大,有点学术味道

4,Web数据挖掘 Bing Liu,刘兵的书,强烈推荐

5,搜索引擎:信息检索实践,很好的书,强烈推荐

 

6.解密搜索引擎技术实战:Lucene & Java精华版

 

还有一些论文,自己去找吧

案例的话,可以研究下Nutch爬虫部分代码,写的很清晰

有了以上这些,应该算是入门了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值