自己动手写网络爬虫

      目前,互联网上的信息迅速膨胀。当你在网上冲浪时,你是否知道还有一类特殊的网络用户也在Internet上默默地工作着,它们就是网络爬虫。这些网络爬虫按照设计者预定的方式,在网络中穿梭,同时自动收集有效的信息,然后进行分类和整理,将整理结果提供给用户,以方便用户查找他们感兴趣的内容。由于网络爬虫的实用性,引起了很多程序员,特别是Web程序员的兴趣。

       但是很多网络爬虫的开发原理与技巧在专业的公司内部秘而不宣。至今仍然缺少理论与实践结合的专门讲网络爬虫的书籍。本书尝试先介绍原理,接着是具体的代码实现分析。本书相关的代码在附带光盘中可以找到,本书两位主要作者在搜索引擎领域都有理论和实践经验。

         该书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。在作者写这本书的时期,搜索引擎开发人员仍然很稀缺。作者真诚的希望通过本书把读者带入搜索引擎开发的大门并认识更多的朋友。



http://item.jd.com/10400758.html

http://product.dangdang.com/20949741.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值