提前声明,该爬虫本身为类人类操作,其胜在可以通过设定时间快速下订单,属于爬虫使用很初级的阶段,比直接提交post慢,各位大佬不要过于的嘲讽😂
那么,我们在刚开始接触爬虫的时候,只是慢慢的通过源码去获取一些数据,但是随着慢慢的学习,我们发现爬虫做这些事情实在是有些杀鸡用牛刀了。那么我们开始一些对网页的操控,这里我们直接以淘宝秒杀为例。
首先,我们需要的环境,win10+selenium模块
关于安装selenium博先前的博客已经讲过。
安装教程
ok,我们直接进行代码详解了。
模块
#coding:"utf-8" 是py文件中可以含有中文
import requests
from selenium import webdriver
import datetime
import time
这里我们总体需要几步,自动进入谷歌->自动进入淘宝->半自动登陆😂->自动进入购物车->自动下单->手动付款
创建我们需要用到的参数。
#创建需要用的变量
#这里的flag是个旗帜变量 定义为1时,python自动选定购物车商品 否则 手动勾选商品
flag = 0
#设置抢购时间 格式为:格式化的时间 即"2020-05-12 20:35:00.000"这种形式
Time="2020-05-12 20:35:00.000"
这里我们进入网址,注意后面的time.sleep是不能少的,因为我发现有时候用爬虫会出现,网速太慢导致页面没加载过来,爬虫就会报错
#创建谷歌实体
web=webdriver.Chrome()
#进入淘宝网
web.get("https://www.taobao.com")
#全屏模式
web.maximize_window()
#等待页面加载完毕
time.sleep(3)
这里实现登陆
#点击并登陆,之后扫码登陆 我们用find找超链接 之后手动点击二维码用手机扫码登录
web.find_element_by_link_text("亲,请登录").click()
#这里留十秒钟时间登陆
time.sleep(10)
接下来就是一个秒下单的过程,当然与网速与电脑反应速度还是有关的😂
#进入购物车
web.get("https://cart.taobao.com/cart.htm")
if flag == 0:
print("手动勾选")
time.sleep(5)
#这里我发现有的时候找不到购买按钮,因此我添加了手动勾选这一环节
else:
while 1:
try:
if web.find_element_by_id("J_SelectAll1"):
web.find_element_by_id("J_SelectAll1").click()
break
except:
print("无法找到购买按钮")
这里注意,以上的操作,都可以在抢购前执行,因为下面才开始用到抢购时间,我们大可以在每一次循环中加一个0.25秒的延迟加刷新页面,这样就可以下单按钮可用的0.3秒内完成下单(当然,与电脑反应速度与网速有关,别跟我说你一个老旧的i5处理器,太慢!😂)
while 1:
time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S.%f')
if time > Time:
while 1:
try:
if web.find_element_by_link_text("结 算"):
web.find_element_by_link_text("结 算").click()
break
except:
pass
while 1:
try:
if web.find_element_by_link_text('提交订单'):
web.find_element_by_link_text('提交订单').click()
break
except:
print("提交订单")
time.sleep(0.01)
ok总体代码:
#coding:"utf-8" 是py文件中可以含有中文
import requests
from selenium import webdriver
import datetime
import time
flag = 0
#设置抢购时间 格式为:格式化的时间 即"2019-06-04 08:35:00.000"
Time="2020-05-12 20:29"
web=webdriver.Chrome()
web.get("https://www.taobao.com")
web.maximize_window()
time.sleep(3)
web.find_element_by_link_text("亲,请登录").click()
#这里留十秒钟时间登陆
time.sleep(10)
web.get("https://cart.taobao.com/cart.htm")
if flag == 0:
print("手动勾选")
time.sleep(5)
else:
while 1:
try:
if web.find_element_by_id("J_SelectAll1"):
web.find_element_by_id("J_SelectAll1").click()
break
except:
print("无法找到购买按钮")
while 1:
time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S.%f')
if time > Time:
while 1:
try:
if web.find_element_by_link_text("结 算"):
web.find_element_by_link_text("结 算").click()
break
except:
pass
while 1:
try:
if web.find_element_by_link_text('提交订单'):
web.find_element_by_link_text('提交订单').click()
break
except:
print("提交订单")
time.sleep(0.01)
这里的操纵其实总体还是类人工模拟,的确是因为博主学识差的有点远,不过随着学习的深入,我后面必然会写一个直接提交post的,现在还有点不太行。哦了。