Android Studio 爬虫 之 简单实现使用 jsoup/okhttp3 爬取购物商品信息的案例demo(附有详细步骤)
目录
一、简单介绍
Android 开发中的一些基础操作,使用Java 实现爬取指定网页的信息的方法整理,便于后期使用。
本节介绍,爬取 https://www.smzdm.com/网页的值得买精选的购物商品信息的方法,其中使用的工具是 jsoup 和 okhttp3。
二、实现原理
1、okhttp3 获得网页的 html 内容
2、jsoup 解析 html 的内容,获取需要的部分信息
三、注意事项
1、网页的 html 有些格式标签可能会变化,具体根据实际最新的网页 html 为准
2、AndroidManifest.xml 中注意添加 INTERNET 权限
3、okhttp3 依赖 okio (最好下载 okio-1.16.0.jar),使用的时候也要添加这个 jar 包
四、效果预览
五、下载相关 jar 包
1、jsoup.jar 下载
1)百度搜索 jsoup.jar
2)点击下载即可
2、okhttp.jar 下载
1)百度搜索 okhttp.jar
2)对应下载即可(若官网打不开,可以使用搜索结果其他方式下载即可)
3、okio-1.16.0.jar 下载
1)百度搜索 okio-1.16.0.jar
2)点击下载即可
六、网页数据分析,以确认 jsoup 解析需要的数据
1、爬取目标网页
2、选中网页右键 检查元素(这里以火狐浏览器为例),查看 html 源码
3、点击选中 鼠标选择器,这样选择 html 就会和 网页 双双对应
4、Elements 的目标 html 为如下