spider
九品稀饭
一只萤火虫
展开
-
Python2和Python3中urllib库中urlencode的使用注意事项
前言在Python中,我们通常使用urllib中的urlencode方法将字典编码,用于提交数据给url等操作,但是在Python2和Python3中urllib模块中所提供的urlencode的包位置有些不同。对于Python2Python2中提供了urllib和urllib2两个模块。urlencode方法所在位置为:urllib.urlencode(values) # 其中values...转载 2018-06-23 10:21:25 · 996 阅读 · 0 评论 -
图解Fiddler如何抓手机APP数据包过滤抓取
使用fidder抓取浏览器的包相信不是问题,那么使用fidder 抓取app的数据包呢???于是,找了一篇博客来学习一下,可以参考一下,根据自己的需求来实现。在网上自己学习,然后整理了我所用到的,以便日后自己还要使用方便查看,在此记录。需要的胖友们也可以查看一、夜神模拟器下载及wifi配置 1、下载地址如下,安装选择默认安装 下载地址1:百度官方下载 ...转载 2018-08-05 11:24:58 · 4357 阅读 · 2 评论 -
python3 chromeDriver 安装与配置
1. 准备工作在这之前请确保已经正确安装好了Chrome浏览器并可以正常运行,安装过程不再赘述。2. 查看版本点击Chrome菜单“帮助”→“关于Google Chrome”,即可查看Chrome的版本号,如图1-14所示。图1-14 Chrome版本号这里我的Chrome版本是58.0。请记住Chrome版本号,因为选择ChromeDriver版本时需要用到。3. 下...转载 2018-08-08 19:16:43 · 11167 阅读 · 1 评论 -
python3 selenium 安装以及验证
1. 相关链接官方网站:http://www.seleniumhq.org GitHub:https://github.com/SeleniumHQ/selenium/tree/master/py PyPI:https://pypi.python.org/pypi/selenium 官方文档:http://selenium-python.readthedocs.io 中文文档:http...转载 2018-08-08 16:58:31 · 1117 阅读 · 0 评论 -
python3 tesserocr 安装 来解决部分爬虫遇到的字符识别问题
1. OCROCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。例如,对于如图1-22和图1-23所示的验证码,我们可以使用OCR技术来将其转化为电子文本,然后爬虫将识别结果提交给服务器,便可以达到自动识别验证码...转载 2018-08-13 18:05:55 · 5218 阅读 · 2 评论 -
proxifier 注册码 +电脑全局代理设置
L6Z8A-XY2J4-BTZ3P-ZZ7DF-A2Q9C(Portable Edition) 5EZ8G-C3WL5-B56YG-SCXM9-6QZAP(Standard Edition) P427L-9Y552-5433E-8DSR3-58Z68(MAC) 这个注册码有啥用?????也没啥具体的教程可能是我的问题,之前也没有具体的说明下:其实吧,这个玩意,有点鸡肋,食之无肉...原创 2018-08-18 11:12:20 · 22004 阅读 · 1 评论