python 自动化处理网页 (urllib , beatuifulsoup ,re)打卡签到

本文介绍了一个使用Python的urllib, BeautifulSoup和正则表达式(re)来实现自动化的网页打卡签到流程。通过解析网页获取动态参数,模拟登录并处理cookie,最终完成在jsp网站上的打卡操作。" 79210563,1533723,机器学习:从传统到深度,"['机器学习', '深度学习', '迁移学习', '强化学习', '集成学习']
摘要由CSDN通过智能技术生成

0x00:python 语言有众多的第三方库,并且本身拥有的库也非常多,这些库也成就了python 这门语言无所不能的称号。

0x01:urllib 是python 处理网页的一个模块,该模块是python 的自带模块,使用时可以直接导入,

beauitfulsoup 是python的一个第三方模块,该模块提供了对网页html 和 xml 文件解析的功能。

0x02:这个脚本的目的,实现某软的打卡签到功能,配合linux cron 即可实现全自动打卡。网站会跟踪cookie 所以脚本中需要有对cookie的处理功能,网站使用js生成参数的方法

防止使用脚本通过post固定的账号密码进行打卡,故脚本需要有模拟登陆的过程而不是直接post 账号密码到一个固定的网站中。

打卡网站使用jsp编写,脚本的流程为:进入打卡网站首页,从网页内读出需要提交到下一个网页的一些参数,

例如在正常的网站中,用户明和密码是为‘user’ ='abc123','password'='ccc456',但是在这个网站中表单中用户名和密码的name 为js在生成网页的时候生成的。

这就需要读取网页并解析出该name。第二步为使用第一个网页解析出的参数加上账号密码一起post到第二个网站中,即完成网站的认证过程。

第三步,根据第二个网站的页面内容找出需要post的表单以及url,生成所需头文件以及post内容提交到第三个网页中去,完成打卡网页的打卡按钮动作。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值