![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 82
胸口好想碎大石
Attitude Matters
展开
-
豆瓣robots.txt分析
豆瓣的robots内容如下: ======================================================== User-agent: * Disallow: /subject_search Disallow: /amazon_search Sitemap: http://www.douban.com/sitemap_index.xml Sitemap:转载 2014-03-01 20:44:13 · 2454 阅读 · 0 评论 -
Java爬虫:爬取豆瓣图片之代码
关于豆瓣相册页面的特征提取和分析,详见我的另一篇博文: 《初涉爬虫:爬取豆瓣图》http://blog.csdn.net/allhaillouis/article/details/20226127 本贴展示代码,效果:爬取豆瓣相册,每个页面的图片分开保存在子文件夹下。 package douban; import java.io.Buff原创 2014-03-07 13:02:41 · 3071 阅读 · 0 评论