Android实现网页图片下载器
网页图片下载器是配合神马笔记图像画廊功能使用的一个工具。
实现了抓取并下载网页页面图片功能。
实现过程:
- 使用WebView加载网页
- 获取网页的原始HTML内容
- 使用jsoup解析HTML数据,提取
<img>
标签 - 下载
<img>
标签内的src
图片链接
实现思路比较清晰,使用WebView加载网页,再用jsoup进行解析,实现难度不大。
到第4步的使用碰到一个问题。
有的页面使用JS脚本动态加载<img>
标签,src
属性并不是真实的图片地址。
此时使用src
下载的图片只是过渡图片,并不是目标图片。
因为每个网站可能使用不同的属性来记录真实地址,目前使用字典的方式来处理。
把所有遇到的特殊属性保存到字典中一个个查询。