Jsoup
文章平均质量分 52
迪迪调调
工作总结与日常学习
展开
-
Jsoup解析网页(一)获取img标签的所有src属性
最近在项目中做一个需求,将一个网页中的外部的图片下载到我们自己的服务器,方法就是对html里的内容匹配出img标签的src的地址,然后利用这个地址下载图片,但总是会出现有的src的地址不是正确的图片资源,出现下载错误的情况,而我在img标签中发现还有data-src属性或者original-src属性,且这些属性里的地址是可下载的。原创 2017-04-17 17:37:29 · 16508 阅读 · 12 评论 -
Jsoup解析网页(二)爬虫解析一个完整的网页
以我做的一个项目中的需求为例子, 需求:爬虫一个网页,将这个网页的内容解析,解析完将这个网页下载到我们自己的服务器保存。然后通过ftp上传到另一个服务器作为外部资源给别人访问。我们就怕一个百度新闻作为测试:http://qijunjie.baijia.baidu.com/article/825950简单的代码:import java.io.BufferedWriter;import java.i原创 2017-04-17 19:44:49 · 1867 阅读 · 0 评论