关于selenium爬虫自动登录爬取数据及自动精准抢购利器

最新推荐文章于 2023-06-19 17:59:09 发布

澄绪猿

最新推荐文章于 2023-06-19 17:59:09 发布

阅读量404

点赞数 2

文章标签： python selenium Powered by 金山文档

本文链接：https://blog.csdn.net/python8181/article/details/129340789

版权

本文介绍了如何利用Python的Selenium库自动化登录12306网站，包括设置ChromeOptions防止浏览器自动关闭，处理滑动验证以及Ajax页面的延迟问题。还提示了应对验证码的方法，如使用第三方工具。

摘要由CSDN通过智能技术生成

首先下载关于selenium库；

关于自动登录12306网的源码（在源码中有各步骤的详细中文解决）：

# 12306网站selenium自动化登录

from selenium.webdriver import Chrome, ChromeOptions
import time
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
options = ChromeOptions()  # 创建谷歌浏览器

options.add_experimental_option("detach", True)  # 修改谷歌浏览器测试选项中的参数，使得打开后的浏览器不会自动关闭
# 添加_实验_选项

# options.add_argument('--start-maximized')  # 这里是不去掉网页头部的大窗口浏览
options.add_argument('--disable-blink-features=AutomationControlled')
# 修改谷歌浏览器中的window.navigator.webdriver(正常浏览器控制台中用来检测是不是机器操作的行为，正常浏览器为False)
# 通过以上对add_argument参数的修改即可

web = Chrome(options=options)  # 创建一个浏览器对象并将修改好的参数传入进去
web.get("https://kyfw.12306.cn/")
 # 打开网页
time.sleep(2)

web.find_element(By.XPATH, '//*[@id="J-userName"]').send_keys('123455678')   # 这两行分别是填入12306的账号与密码
web.find_element(By.XPATH,'//*[@id="J-password"]').send_keys('876545321')    # 这里用来演示就不是真实账号
web.find_element(By.XPATH,'//*[@id="J-login"]').click()
time.sleep(2)   # 这里的休眠很重要，不然反应太快脚本识别不到要拖动的东西，会报错！！！
btn = web.find_element(By.XPATH, '//*[@id="nc_1_n1z"]')   # 这里你注意找XPATH时在脚本自动打开的浏览器中找，不然位置不一样会报错
# 找到需要拖拽验证的滚动条
time.sleep(2)
ActionChains(web).drag_and_drop_by_offset(btn, 450, 0).perform()
# 从selenium.webdriver 中引入 ActionChains(链条)模块
# drag_and_drop_by_offset为拖拽的功能指令其中需传入的参数依次为 1.需拖拽的位置，2.横向拖拽的距离.3.纵向拖拽距离
# perform()执行指令
print(f"12306网自动化登录程序", end='\n''over!')

注：上面代码重要的点：