我们先来尝试抓包:
1)启动安卓模拟器,设置系统代理为Fiddler。
2)启动裁判文书网App。
3)执行一些操作,比如搜索某关键词,在Fiddler中可以看到对应的HTTP请求和应答数据。如下图所示。
很不幸运的是应答正文数据被加密了(现在大部分App都采用了加密或者签名机制来反采集),下面我们重点来分析如何加密。
1)反编译wenshuapp.apk文件,然后有耐性地浏览它的源码(这点很重要,我们分析了很久,在最后差点要放弃的时候才有所突破的)。你会找到它是采用AES算法加密的,幸运的话你还可以找到它的秘钥串。
2)得到秘钥串后我们来验证下。
3)然后就可以在自己的爬虫中实现这个解密过程,成功抓取到App接口的数据了。
Good luck!
转载至:http://www.site-digger.com/html/articles/20170703/136.html