- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 关于使用JAVA来实现爬虫的一个简单的DEMO(2)
好的,再(1)中,我们实现了获取标题,那么,能不能获取复杂一点的呢,比如说下载图片啥的(我的初衷)。 总所周知,下载文件需要啥,需要一个URL对吧,咱拿我最近的一个练手的网站来说吧。(媚韵) 众所周知,这个爬虫肯定是很多时候不能通用的,得因站制宜。我们得先观察一下它的结构才行。<p><img class="aligncenter size-full wp...
2020-01-31 12:17:39 211
原创 关于使用JAVA来实现爬虫的一个简单的DEMO(1)
这是一篇对于爬虫初学者的简单教程,需要一点正则表达式的基础,以下是我自己对爬虫的看法。 爬虫,主要是爬取页面的展示元素,即查看源代码的内容。(鼠标右键可看到)(如下图所示)那么,最基础的获取这个源代码。1.获取源代码 /** * 获取网页源码 */ public String getHtml(String url) throws Exception { UR...
2020-01-27 22:26:21 130
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人