python + selenium + chrome 爬取淘宝总结

1、打开浏览器 查看浏览器版本或者直接输入 chrome://version/
在这里插入图片描述
2、下载浏览器版本对应的chromedriver.exe 下载链接 http://chromedriver.storage.googleapis.com/index.html

3、修改chromedriver.exe,使用Notepad++ 打开chromedriver.exe 查找$cdc,把红线框的这部分修改(随意修改什么,保持位数不变,这一步的目的是为了跳过淘宝对selenium的检测)
在这里插入图片描述
4、导入包和配置


from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC

prefs = {'credentials_enable_service': False,
         'profile.password_manager_enabled': False,
         'profile.managed_default_content_settings.images': 2}

chrome_option = webdriver.ChromeOptions()
# 这个开发者模式,不能少,配合第三步改chromedriver的,不然是不能自动登录的
chrome_option.add_experimental_option('excludeSwitches', ['enable-automation'])  
chrome_option.add_experimental_option("prefs", prefs)
chrome_option.add_argument(
    'User-Agent=Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36'
)
driver = webdriver.Chrome(options=chrome_option)
wait = WebDriverWait(driver, 10)

5、登录函数


def login(TB_username,TB_password):
    driver.get('https://login.taobao.com/member/login.jhtml')
    username = wait.until(
        EC.presence_of_element_located(
            (By.CSS_SELECTOR, '#TPL_username_1'))
    )
    password = wait.until(
        EC.presence_of_element_located(
            (By.CSS_SELECTOR, '#TPL_password_1'))
    )
    username.send_keys(TB_username)
    password.send_keys(TB_password)
    login_submit = wait.until(
        EC.presence_of_element_located(
            (By.CSS_SELECTOR, '#J_SubmitStatic'))
    )
    login_submit.click()

TB_username = ""  # 淘宝登录用户名
TB_password = ""  # 登录密码
login(TB_username, TB_password)

6、爬取数据具体逻辑的代码这个根据自己需求而定就不发,照需求弄就得了。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hi 你好。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值