- 博客(6)
- 收藏
- 关注
原创 selenium+Python 爬虫系列
今天使用selenium+python对一个认证网站下手了。在查询数据的时候出现了验证码。使用了超级鹰打码平台进行验证。导入selenium模块和图片处理模块from selenium import webdriverfrom PIL import Imagefrom selenium.webdriver import ActionChains使用Chromedriver插件打开浏览器网站driver = webdriver.Chrome(r'E:\浏览器下载\chromedriver
2020-05-16 12:03:21
621
1
原创 轻松拿到51job数千条职位信息
51job数据抓取导入模块import time # import csvimport requestsfrom lxml import etreeU-A伪装headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chro...
2020-03-29 11:47:42
216
原创 selenium模拟登陆12306
超级鹰网址http://www.chaojiying.com/user/mysoft/注册用户,在用户中心创建软件,拿到其中的软件ID在开发文档中找到对应的Demo下载解压,拿到py文件(代码中可能会有代码缩进问题)在价格体系中找到目标网站的验证码类型验证码返回中pic_id为目标坐标,所以在代码中直接获取目标点坐标print(chaojiying.PostPic(im, 90...
2020-03-24 13:31:08
662
1
原创 简单易懂的python装饰器
装饰器利用高阶函数和闭包,实现不改变已实现的功能和调用方式的情况下增加功能def log(func): def inner(*args, **kw): print('call %s():' % func.__name__) return func(*args, **kw) return inner @logdef now(): ...
2020-03-20 12:46:25
89
原创 hadoop集群安装
hadoop集群安装使用root用户查看用户ls –l /home给hadoop用户赋权vi /etc/sudoers hadoop ALL=(ALL) ALL # 修改 更改主机名vim /etc/sysconfig/networkNETWORKING=yes HOSTNAME=slave2IP映射vim /etc/hosts192.16...
2020-03-20 12:39:05
74
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人