最近在研究爬虫方面的东西,头发掉了不少,现在的反爬措施真的是反人类,尤其是这些电商大佬们,搞得我整体掉头发!
而且现在网上的教程真的是想骂人,复制粘贴连格式都不改,可是还得看啊,一篇一篇翻,一样的...一样的...一样的...头发又少了!
后面我就不说某东了,因为它的图片看着像条狗,后面我就用小狗代替了。
好了,唠叨完了,开始撸代码。
第一步:安装
安装Python,IDE,chrome,webdriver,这些不难,网上教程也很多,我就不写了,耐心点找这些都没问题。
第二步:各中库的安装python3自带了很多库,多少都不用管了,下面代码引入的库我就只说一部分吧
- selenium,不用多说吧,你们都懂,嘿嘿!
- cv2,用来做图片验证码识别的,你们要是懒得研究就pycharm或者pip安装就行,流程我就不贴了,安装的时候是opencv-python,不要直接去找cv2啊,兄弟们,安装好以后导入包的时候直接导cv2就可以了。
- numpy,python的科学计算库,也是用来处理图片验证码的。
- urllib这个库python3自带,引这个库是用来下载验证码图片的,这个还是建议你去查一查资料(懂得人忽略),小狗的验证码图片用了这种形式: