爬虫问题记录 实施过程 爬取ip池开发者模式查看正常访问产生的post/get,以及一系列记录 - header等数据都在这里 - 爬取出现非代码问题看抓包过程,或者在记录找是不是动态隐藏数据匹配处理html非格式化数据pandas 注意问题 ssl验证(有时候很坑),代码设置一下不要sslip被干掉了,维护个ip池就行动态数据,试一下selenium()其他反爬虫问题,还没发现