本文属于专栏python爬虫登录,该专栏列举了10+个网站的登录破解办法,如感兴趣,欢迎关注及订阅。
录入的网站有:
- 1688
- 淘宝
- 信发集团
- 上海有色网
- 厦钨平台
- 用友商业创新平台
- 京满仓(工品汇)
- 米思米
- 三块神铁
- 怡合达
- 万千紧固件
- 工品一号
其中技术难点包括验证码识别,js逆向分析等。网站持续增加中…
如以上网站不在您需要的范围内,欢迎私信询问(q:1461124250)。
# - * - coding : utf-8 - * -
import urllib3
urllib3.disable_warnings()
import os
import re
import math
import json
import random
import time
import demjson
import requests
import hashlib
import base64
import execjs
from PIL import Image
from urllib.parse import urlencode, quote
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.common.exceptions import NoSuchFrameException, NoSuchElementException, NoAlertPresentException
from utils.request import Request
from utils.db_conf import MysqlConf
from utils.en import H
rq = Request()
def login_gpyh():
"""
工品一号
需要js触发才能成功验证,故使用selenium
"""
url = 'https://passport.gpyh.com/passport/login'
options = Options()
prefs = {"profile.managed_default_content_settings.images": 2}
options.add_experimental_option("prefs", prefs)
options.add_argument('--headless')
driver = webdriver.Chrome(options=options)
driver.get(url)
u = driver.find_element_by_css_selector('[id="username"]')
u.click()
time.sleep(1)
u.send_keys('xxx')
time.sleep(1)
p = driver.find_element_by_css_selector('[id="password"]')
p.send_keys('xxx')
time.sleep(1)
driver.find_element_by_css_selector('.loginBtn').click()
time.sleep(3)
cookies_jar = driver.get_cookies()
# print(cookies_jar)
cookies = {}
for c in cookies_jar:
# cookies += c['name'] + '=' + c['value'] + ';'
cookies.update({c['name']: c['value']})
driver.close()
return cookies
注:本文仅可用于技术交流,请勿用于非法用途,欢迎咨询(q 1461124250)。