测试时间:2021年11月11日
大家做爬虫的时候肯定会遇到很多验证码列如本文所指的图像识别:
小伙伴们我讲的可能会比较啰嗦,还希望你们不要嫌弃
豆瓣提供图书、电影、音乐唱片的推荐、评论和价格比较,以及城市独特的文化生活。https://www.douban.com/
这次以豆瓣登录为例:滑块验证码会在输入账号密码点击登录之后弹出来
我们现在要做的呢就是获取账号和密码以及登录的元素 ,这个大家应该都会没啥好说的,注意的一点是这个登录界面是一个嵌套网页在iframe里面,需要先切入在获取元素不然获取不到
from selenium import webdriver
import requests
import cv2.cv2 as cv2
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver import ChromeOptions # 这个包用来规避被检测的风险
import time # 延迟
from selenium.webdriver import ActionChains # 动作链
option = webdriver.ChromeOptions()
option.add_experimental_option('useAutomationExtension', False)
option.add_experimental_option('excludeSwitches', ['enable-automation'])
driver_path = r'驱动得位置' # 定义好路径
driver = webdriver.Chrome(executable_path=driver_path,options=option) # 初始化路径+规避检测
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": """
Object.defineProperty(navigator, 'webdriver', {
get: () => undefined
})
"""
})
url='https://www.douban.com/'
def denglv():
driver.get(url)
time.sleep(4)
driver.switch_to_frame(driver.find_element_by_xpath('//*[@id="anony-reg-new"]/div/div[1]/iframe')) #切入登录网址
dianjimimadenglv=driver.find_element_by_xpath('/html/body/div[1]/div[1]/ul[1]/li[2]').click() #点击账号密码登录
time.sleep(1)
zhanghao=driver.find_element_by_xpath('//input[@id="username"]').send_keys('ununun') #输入账号
time.sleep(1)
mima=driver.find_element_by_xpath('//input[@id="password"]').send_keys('7878787878'