java爬虫
文章平均质量分 78
wangquanjava
这个作者很懒,什么都没留下…
展开
-
使用Java爬虫得到CSDN博客信息并保存(一)
1. 需求: 上一篇文章已经可以得到博客中的信息,这篇博客将示范把信息以txt文件的形式保存到本地 2. 代码实现: package cn.test12.WebRobot04; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import ja原创 2015-11-03 22:33:00 · 365 阅读 · 0 评论 -
使用Java爬虫得到CSDN博客信息并保存(一)
1. 需求: 使用java爬虫得到blog.csdn.net首页的所有出现的博客地址,并逐个访问,把博客信息保存到本地。 2. 思路: (1).通过URL类的方法得到首页的HTML源码,使用正则把博客的url都放到一个String数组中 (2).再逐个访问个人博客的首页得到HTML源码,使用正则提取到需要的信息 (3).使用IO把得到原创 2015-11-03 22:31:43 · 540 阅读 · 0 评论