![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎技术
denniswlin
这个作者很懒,什么都没留下…
展开
-
自己动手写网络爬虫
http://book.51cto.com/art/201012/236661.htm第1篇 自己动手抓取数据第1章 全面剖析网络爬虫 31.1 抓取网页 41.1.1 深入理解URL 41.1.2 通过指定的URL抓取网页内容 61.1.3 Java网页抓取示例 81.1.4 处理HTTP状态码 101.2 宽度优先爬虫和带偏好的爬虫 11转载 2011-11-23 09:09:03 · 7010 阅读 · 3 评论 -
搜索&爬虫
HTML解析利器HtmlAgilityPackhttp://zhoufoxcn.blog.51cto.com/792419/595344通过HtmlAgilityPack+XPath来优化网页采集学习笔记http://www.cnblogs.com/youuuu/archive/2011/06/20/2085333.html 利用SgmlReader返回XPath分析H原创 2011-10-12 17:57:40 · 691 阅读 · 0 评论