1.引用库
#打开浏览器
from selenium import webdriver
#定位用
from selenium.webdriver.common.by import By
#延时
import time
#资源请求
import requests
#资源保存
import os
2.常用方法
def class_exist(class_name):#判断是否有元素class为class_name
try:
driver.find_element(By.CLASS_NAME,class_name)
return True
except:
return False
def text_exist(text):#判断是否有元素文本为text
try:
driver.find_element(By.LINK_TEXT,text)
return True
except:
return False
3.常用代码
driver=webdriver.Chrome()#打开谷歌浏览器
driver.get(r"https://")#访问网页
for i in range(0,10):#for循环从0到9
print('{:03d}'.format(i))#输出000格式
######################使用ActionChains类模拟滚轮向下滑动
body = driver.find_element(By.TAG_NAME,'body')
actions = webdriver.ActionChains(driver)
for i3 in range(200):#下滑两百次
actions.move_to_element(body).send_keys(webdriver.Keys.PAGE_DOWN).perform()
print('下滑'+str(i3))
time.sleep(0.05)
######################
#####################获取标题,创建文件夹
title=driver.find_element(By.CLASS_NAME,'').text#获取标题
folder_path = os.path.join(os.getcwd(),title)#获取python文件路径,合成绝对路径
if os.path.exists(folder_path) and os.path.isdir(folder_path):
print('文件夹已存在,不再创建文件夹')
else:
print('文件夹不存在,创建文件夹')
os.mkdir(folder_path)
#####################
##########################定位全部img,获取src
#定位全部img
img_list=driver.find_elements(By.CLASS_NAME,'')
#遍历
for i in range(len(img_list)):
print(str(i))
#########获取图片src
img=img_list[i].get_attribute("src")
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
#########请求资源
response = requests.get(img, headers=headers,timeout=(5,5))
#########得到资源内容
content=response.content
###########################
###########################根据content,保存文件
file_name='1.jpg'
#获取python文件路径,加上文件名,合成绝对路径
file_path=os.path.join(os.getcwd()+file_name)
with open(file_path, 'wb') as f:
f.write(content)
time.sleep(0.5)
###########################