![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
风叶翩翩
有过众多的项目开发经验。精通Java开发,Sql数据库等,熟练使用主流开发工具如IDEA等。对开发编程有着特殊的爱好和恒心。
展开
-
jsoup 简单应用
JSOUP指的是前端爬虫框架,对HTML网页的一系列操作包括信息的获取内容的修改等。jsoup简单应用1.三种加载HTML的方法 @Test public void test1() throws IOException { //从URL加载HTML Document document = Jsoup.connect("http://www.gug...原创 2020-01-22 11:32:44 · 177 阅读 · 0 评论 -
JSOUP
很多人在看到这个词的时候会感觉到陌生,不知道这个词到底是干什么的,jsoup网页爬虫框架jsoup 是一款Java 的HTML解析器。可直接解析某个URL地址、HTML文本内容。它提供了一套很省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。jsoup主要功能从一个URL,文件或字符串中解析HTML。使用DOM或CSS选择器来查找、取出数据。...原创 2020-01-18 16:35:45 · 262 阅读 · 0 评论 -
java爬取单张图片
我们经常需要在网页上获取一些图片,有的图片我们是可以直接下载使用,有的图片需要我们登陆账号甚至付费下载,所以在此我写了一个使用Java爬取任意网页单张图片的爬虫。代码解析1.图片的网络位置2.进行访问和下载3.建立本地存储位置效果演示爬取之后图片存放的文件夹和图片代码展示import java.io.ByteArrayOutputStream;import java.io.Fi...原创 2019-12-29 15:16:11 · 243 阅读 · 0 评论 -
java爬取小说
使用Java爬取网站:http://www.shicimingju.com的小说内容代码详解1.在本地创建存储位置2.编写正则表达式3.循环获取内容4.把内容存入文件夹中5.判断成功或失败效果演示代码展示package text;import java.io.BufferedReader;import java.io.BufferedWriter;import ja...原创 2019-12-29 14:18:32 · 1007 阅读 · 5 评论