文章目录
-
-
Python读写Excel文件
- openpyxl —> XML —> xlsx
- xlrd / xlwt —> xls
- xlwings
-
每个Excel文件 —> 工作簿 —> Workbook
-
一个Excel文件可以包含多个工作表 —> Sheet —> 行和列
-
行和列交汇的地方叫做单元格 —> Cell
-
商业爬虫项目,要提前创建好代理池(很多组IP代理,失效的代理会被移除,代理会定时更新)
-
付费商业代理一般购买之后都是提供一个网络API接口(URL),通过请求这个接口就可以获得代理的信息
-
我们使用的蘑菇代理提供的API接口返回JSON格式的数据,可以通过Response对象的json()方法将
-
返回的JSON的数据处理成字典,再从中提取出IP代理的信息
-
商业爬虫项目,需要提前创建好一个cookies池,每次请求从池子中随机选择一组Cookie信息