java爬虫
零零叁2019
这个作者很懒,什么都没留下…
展开
-
java爬虫(一)--下载html
需要的包Jsoup1.6.jar 效果图: 第一步、先建一个类,将操作部分封装,传入网址u和目录mkd public class DownLoadPage { public static void downloadPage(String u,String mkd){ } } 1.1 传入的网址不一定是域名格式,需要我们解析成域名 URL url=new URL(...原创 2018-04-08 21:47:35 · 1466 阅读 · 3 评论 -
Java 爬虫(二)
在前面的基础上做了一点修改,直接上源码,代码有注释 package test; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io.InputStreamReader; import...原创 2018-04-15 11:20:46 · 175 阅读 · 0 评论 -
Java爬虫(三)--获取网页中的所有地址
在这里就懒得处理异常,代码很简单,看注释 package test; import java.net.URL; import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.jsoup.Jsoup; ...原创 2018-04-15 12:19:25 · 983 阅读 · 0 评论