学习python,最好的入门方法或许就是从爬虫薅羊毛开始。前几天搞了一个每日自动抽取大众点评霸王餐的爬虫。运气不够就让勤奋来弥补好了,总会有抽中的一个吧hhhh....
先看个效果图
反正就是每天自动检测有没有新项目,有的话就抽奖,并且把抽过奖的项目添加到数据库中...看上图可得,几乎每天都有几个更新...
接下来直接mark代码好了....把我自己账号的cookies打了个码....
整体思路就是:
1)获取霸王餐首页的抽奖项目id
2)判断这些id在数据库中是否存在,把不存在的单独拎出来
3)找到报名活动的请求,然后模拟post请求
4)设置定时任务,每天定时跑一次...
很少几个步骤,便完成了薅羊毛的活动.....
我在IDE中运行下,看看效果(因为定时任务今天已经跑了,所以会提示无新的项目)
补充说明
1、上面的源码中,你可以不用数据库记录,减少一点工作量。
2、然后需要把cookies换成自己登陆后的
3、在用json解析的时候,需要变动下面部分:
4、定时任务的话,直接在dos中,设置crontab,相关办法可以直接百度,难度不大。
贴下源码吧,但显示出来的格式真的是...
importrequests
importjson
importtime