【Python爬虫】利用selenium实现大麦网抢票,手把手保姆级教程!

一、selenium原理

  • Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera,Edge等。
  • 这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成.Net、Java、Perl等不同语言的测试脚本。(来源于百度百科)
  • 在这里,我们使用python调用selenium进行编程实现。

二、项目实战操作

本次实现使用python3.10版本

①导入项目需要的外部包

这里导入selenium包与改包中的By包。(因为使用了最新的selenium语法,需要使用By包中的类)
import os
import time
import pickle
from time import sleep
from selenium import webdriver
from selenium.webdriver.common.by import By

②设置需抢票页面

# 大麦网主页
damai_url = "https://www.damai.cn/"
# 登录页
login_url = "https://passport.damai.cn/login?ru=https%3A%2F%2Fwww.damai.cn%2F"
# 抢票目标页
target_url = 'https://detail.damai.cn/item.htm?spm=a2oeg.home.card_0.ditem_2.591b23e1HR8K6w&id=762298097902'
  • 这里的目标页为我随便选择的一个,大家可根据自己的需要修改抢票目标页。

③定义具体类

需要注意文章中的所有方法都是在该类下定义的方法。
class Concert:
    def __init__(self):
        self.status = 0         # 状态,表示如今进行到何种程度
        self.login_method = 1   # {0:模拟登录,1:Cookie登录}自行选择登录方式
        self.driver = webdriver.Chrome()       # 默认Chrome浏览器

④通过cookie进行登陆

这个方法调用是在Concert类中login_method = 1是才会使用到,便于快速登陆,省去登陆过程,其中初次运行代码时,用户登陆后会在本地生成cookies.pkl文件来存储cookie信息,用于快速登陆。
    def set_cookie(self):
        self.driver.get(damai_url)
        print("###请点击登录###")
        while self.driver.title.find('大麦网-全球演出赛事官方购票平台') != -1:
            sleep(1)
        print('###请扫码登录###')

        while self.driver.title != '大麦网-全球演出赛事官方购票平台-100%正品、先付先抢、在线选座!':
            sleep(1)
        print("###扫码成功###")
        pickle.dump(self.driver.get_cookies(), open("cookies.pkl", "wb"))
        print("###Cookie保存成功###")
        self.driver.get(target_url)


    def get_cookie(self):
        try:
            cookies = pickle.load(open("cookies.pkl", "rb"))  # 载入cookie
            for cookie in cookies:
                cookie_dict = {
                    'domain':'.damai.cn',  # 必须有,不然就是假登录
                    'name': cookie.get('name'),
                    'value': cookie.get('value')
                }
                self.driver.add_cookie(cookie_dict)
            print('###载入Cookie###')
        except Exception as e:
            print(e)

⑤登陆

在登录后页面会跳转至所选演唱会详情界面
    def login(self):
        if self.login_method == 0:
            self.driver.get(login_url)
            # 载入登录界面
            print('###开始登录###')

        elif self.login_method == 1:
            if not os.path.exists('cookies.pkl'):
                # 如果不存在cookie.pkl,就获取一下
                self.set_cookie()
            else:
                self.driver.get(target_url)
                self.get_cookie()

⑥打开浏览器

   def enter_concert(self):
        """打开浏览器"""
        print('###打开浏览器,进入大麦网###')
        self.driver.maximize_window()           # 最大化窗口
        # 调用登陆
        self.login()                            # 先登录再说
        # self.driver.refresh()                   # 刷新页面
        self.status = 2                         # 登录成功标识
        print("###登录成功###")

选择票型

选择具体票型部分未写,该部分可由读者们自行添加,不添加的话,自行选择进入页面后大麦的默认选择。
   def choose_ticket(self):
        if self.status == 2:                  #登录成功入口
            print("="*30)
            print("###检查是否开始售票###")
            while not self.isElementExistByClass('buy-link'):
                self.driver.refresh()
                print("###售票尚未开始,刷新等待开始###")
            #TODO 选择票型
            #========begin=========

            #========end===========
            self.driver.find_element(By.CLASS_NAME, 'buy-link').click()    #点击购票二维码下的购买连接
            time.sleep(1.5)
            self.check_order()
通过观察目前(2024.1.27)PC端浏览器中大麦的购票流程,进入演唱会详情界面后若已经开售则会出现购票二维码,推荐使用手机支付,在其下有个浏览器支付的连接,点击后才会进入订单确定界面。这里的time.sleep不能删去,在Http请求响应完成之前,直接执行下面的操作的话会出现错误,所以这里选择sleep,让HTTP响应能够完成,页面完成加载。

⑦确认订单

   def check_order(self):
        if self.status == 2:
            print('###开始确认订单###')
            if self.driver.title == '订单确认页':
                print('###检查是否需要填写观影人')
                if self.isElementExistByXPATH('//*[@id="dmViewerBlock_DmViewerBlock"]'):
                    self.driver.find_element(By.XPATH, '//*[@id="dmViewerBlock_DmViewerBlock"]/div[2]/div/div').click()
                    time.sleep(0.5)
                print('###跳转支付选择界面###')
                self.driver.find_element(By.XPATH, '//*[@id="dmOrderSubmitBlock_DmOrderSubmitBlock"]/div[2]/div/div[2]/div[2]/div[2]').click()
                time.sleep(2)
                self.pay_order()
跳转至支付界面后,系统仍然会推荐使用手机支付宝支付,在这里我们选择中间的在浏览器支付,这样会跳转至支付宝登陆界面。

支付宝登陆支付

def pay_order(self):
        if self.driver.title == "支付宝付款":
            print('###支付订单###')
            if self.isElementExistByXPATH('//*[@id="app"]/div[3]/div[1]/button[2]'):
                self.driver.find_element(By.XPATH, '//*[@id="app"]/div[3]/div[1]/button[2]').click()
                print('###跳转至浏览器支付###')
                time.sleep(1.5)
                self.driver.find_element(By.XPATH, '//*[@id="app"]/div[3]/div/div[1]/div[2]/input').clear()
                self.driver.find_element(By.XPATH, '//*[@id="app"]/div[3]/div/div[1]/div[2]/input').send_keys('支付宝账号')      #输入支付宝账号
                self.driver.find_element(By.XPATH, '//*[@id="app"]/div[3]/div/button').click()
                time.sleep(1.5)
                self.driver.find_element(By.XPATH, '//*[@id="app"]/div[2]/button').click()
                while True:
                    time.sleep(1)
                    print('###请输入支付密码###')
大家需要使用时将支付宝账号改为自己的账号。
这个方法主要是跳转至支付宝登录界面后自动填写支付宝账号,首先填写账号后会跳转至手机短信发送, 此时我们选择下面的支付密码,然后跳转至支付密码的输入。由于支付密码过于隐私,此处未实现自动输入支付密码(不然测试时直接付款了哭都来不及)。

脚本结束退出

def finish(self):
        self.driver.quit()

main方法

if __name__ == '__main__':
    try:
        con = Concert()  # 具体如果填写请查看类中的初始化函数
        con.enter_concert()  # 打开浏览器
        con.choose_ticket()  # 开始抢票

    except Exception as e:
        print(e)
        con.finish()

三、机器检测问题

看到这里的小伙伴们呢应该在运行上述代码时发现了,在登陆后进入确定订单时,大麦会进行机器检测的情况,而且自己手动验证无法通过。
这个情况涉及到了机器人检测。这个程序的本质是使用测试工具进行抢票操作,使用的driver会被识别为机器人,无法欺骗到检测程序,这里我们使用stealth.min.js进行解决。
其实stealth.min.js这个文件应该不用我多介绍了,是puppeteer中用于抹去自动化程序特征的。当他被单独提取出来后就可以在selenium中加载并使用,使得可以抹掉selenium中的自动化特征,从而绕过一些网站或者验证程序的机器人检测。
关于这个文件在Python的selenium的用法其实很简单,就是在初始化完webdriver后使用execute_cdp_cmd函数来执行这个js文件即可
# 初始化webdriver
driver = webdriver.Chrome()
# 读取文件
with open('stealth.min.js', 'r') as f:
    js = f.read()
# 调用函数在页面加载前执行脚本
driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': js})
然后就可以正常使用driver来进行其他操作了

四、总结

该程序利用了selenium自动测试工具实现了抢票的一个简单脚本,相当于是对抢票功能的一个测试用例,但用在了具体抢票这件事上。同时提醒读者,该脚本在目前的大麦网上能够实现该功能,由于使用了XPATH的定位方式,若大麦网进行页面UI更改时,需要在新界面的基础上修改程序中的XPATH。

今天的分享就到这里,喜欢且对你有所帮助的话,记得点赞关注哦~下回见 !

  • 26
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
### 回答1: 我可以回答这个问题。Python可以使用selenium库模拟浏览器操作,实现自动登录、选择场次、填写订单信息等操作,从而实现大麦抢票。同时,也可以使用requests库模拟HTTP请求,获取抢票页面的信息。需要注意的是,抢票需要在短时间内完成多个操作,需要编写高效的代码。 ### 回答2: Python实现大麦抢票需要使用爬虫技术和自动化操作技巧。以下是基本的实现步骤: 1. 导入相应的Python库,如selenium和BeautifulSoup等。 2. 使用selenium库打开大麦抢票页面,可以通过webdriver模块选择所需浏览器,并设置相关参数。 3. 使用selenium模拟用户登录大麦,输入用户名和密码,并点击登录按钮。 4. 使用selenium模拟输入所需搜索的演出或活动名称,并点击搜索按钮。 5. 使用BeautifulSoup库解析搜索结果页面的HTML内容,找到目标演出或活动的信息。 6. 根据所需的票价和座位数等条件,筛选出符合要求的演出或活动。 7. 使用selenium模拟点击目标演出或活动的购票按钮。 8. 切换到新打开的购票页面,选择需要购买的票种和座位,并填写购票人信息。 9. 点击确认购买按钮,输入支付密码或验证信息。 10. 检查购买结果,如成功购买,则完成抢票过程;如失败,则返回步骤3重新尝试。 需要注意的是,由于大麦可能会更新页布局和反爬机制,因此上述方法可能会随着时间的推移而失效。为了保持抢票的效率和稳定性,建议定期检查和更新代码,以适应大麦的变化。同时,为了避免对系统造成过大负担,建议合理控制抢票频率和使用合法的账户进行操作。 ### 回答3: Python可以通过模拟用户登录、自动刷新页面、自动填写订单信息等方式来实现大麦抢票。 首先,Python可以使用Selenium库来模拟用户登录大麦。通过自动填写用户名和密码,实现自动登录操作。登录成功后,可以获取对应的Cookie信息,保持登录状态。 接下来,Python可以使用Selenium库来自动刷新大麦的演出页面。通过定时刷新页面,可以实时获取最新的演出信息和票价。 当有演出开放售票时,Python可以使用Selenium库来自动填写订单信息。根据用户的需求,可以选择合适的演出、场次、座位等信息。填写完订单信息后,点击购买按钮完成下单操作。 在抢票过程中,Python可以使用多线程或者分布式技术来提高抢票的效率。通过同时运行多个抢票的程序,可以增加抢票的成功率。 最后,Python可以使用邮件或短信等方式来通知用户抢票的结果。当抢票成功时,发送通知给用户;当抢票失败时,可以重新执行抢票程序,或者发送失败通知给用户。 总之,Python可以通过模拟用户操作、自动化填写订单信息等方式来实现大麦抢票功能。通过合理的抢票策略和技术手段,可以提高抢票的效率和成功率。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值