Python自动化爬取App数据

本文介绍了使用Python进行App数据爬取的流程,包括环境配置(Python、JDK、Appium、Android SDK、Selenium、Chromedriver、pymongo、MongoDB Server),爬取思路(模拟登录、抓取动态、保存数据),Android SDK安装与配置,Desired Capabilities参数设置,开启开发者选项和USB调试,节点ID或XPATH值获取,以及针对“是否匹配通讯录”的选择。同时,分享了朋友圈信息的获取思路和日期处理方法,提供了完整代码及注意事项。
摘要由CSDN通过智能技术生成

基本环境配置

版本:Python3

系统:Windows

需要安装:

1.JDK - Download JDK,Appium要求用户必须配置JAVA环境, 否则启动Seesion报错。

2.Appium - Download Appium, 安装过程请自行搜索。

3.Android SDK - Download SDK

4. Selenium - 建议使用低版本的Python Selenium库,在Chrome高版本可能会报错。例如:

pip3 install selenium==2.48.0

5. chromedriver.exe - Download Chromedriver, 确保版本要匹配, 然后将 .exe 程序放在"..Python\Python36\Scripts"目录下。

6. pymongo

pip3 install pymongo

7. MongoDB Server - Download MongoDB

爬取思路

爬取思路:

  • 模拟登录

  • 抓取动态

  • 保存数据

Android SDK的安装与配置

打开Android Studio, 选择"Configure->SDK Manager->Apperance&Behavior->System Settings->Android SDK", 选择对应安卓机版本的SDK,如图:

 

此外,还需要将SDK所在路径添加到系统环境变量中,否则报错。

Desired Ca

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值