最近看了看Jsoup的使用,使用它可以解析html网页中的内容,筛选出我们需要的内容。它和Python中的BeautifulSoup类似,找标签就行了,使用起来相对简单,方便。代码地址https://github.com/SZJing/BiZhiApp
效果图
首先抓取图片的网址是这个网址http://www.win4000.com/mobile_0_0_0_1.html,这上面有好多类型的壁纸,我只弄了部分手机壁纸。那为什么选这个网页呢?,主要原因就是这个网页的图片链接在网页中式明文,直接就可以获取,并没有进行反爬取。其次是这上面的图片看起来还可以。
接下来进入正题,获取网页、加载图片、展示图片什么的我就不说了,不懂可以看我的上一篇干货集中营app制作,如果还是不懂,那就百度搜搜吧,这类的文章很多。我主要的就是讲讲怎样解析html中的数据,筛选出我们需要的东西。
在解析的时候我们可以右键网页,找到查看网页源代码,点击,就可以看到整个网页的源代码了。我们通过代码获取的网页就是这个网页的源代码,只不过我们在浏览器中分析会更方便。
我们需要上面的壁纸图片,所以我们就找加载壁纸图片所对应的网页代码。最终找到的应该是下面一段
<div class="w1180 clearfix">
<div class="Left_bar">
<div class="list_cont Left_list_cont Left_list_cont2">
<div class="tab_tj">
<div class="tab_box">