python selenium库常用命令

技术小零

已于 2023-04-25 14:47:40 修改

阅读量226

点赞数

分类专栏： python 文章标签： python selenium 爬虫

于 2023-04-23 22:08:31 首次发布

本文链接：https://blog.csdn.net/weixin_46616558/article/details/130331599

版权

python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.引用库

#打开浏览器
from selenium import webdriver
#定位用
from selenium.webdriver.common.by import By
#延时
import time
#资源请求
import requests
#资源保存
import os

2.常用方法

def class_exist(class_name):#判断是否有元素class为class_name
    try:
        driver.find_element(By.CLASS_NAME,class_name)
        return True
    except:
        return False
def text_exist(text):#判断是否有元素文本为text
    try:
        driver.find_element(By.LINK_TEXT,text)
        return True
    except:
        return False

3.常用代码

driver=webdriver.Chrome()#打开谷歌浏览器
driver.get(r"https://")#访问网页

for i in range(0,10):#for循环从0到9
    print('{:03d}'.format(i))#输出000格式


######################使用ActionChains类模拟滚轮向下滑动
body = driver.find_element(By.TAG_NAME,'body')
actions = webdriver.ActionChains(driver)
for i3 in range(200):#下滑两百次
    actions.move_to_element(body).send_keys(webdriver.Keys.PAGE_DOWN).perform()
    print('下滑'+str(i3))
    time.sleep(0.05)
######################


#####################获取标题,创建文件夹
title=driver.find_element(By.CLASS_NAME,'').text#获取标题
folder_path = os.path.join(os.getcwd(),title)#获取python文件路径，合成绝对路径
if os.path.exists(folder_path) and os.path.isdir(folder_path):
    print('文件夹已存在，不再创建文件夹')
else:
    print('文件夹不存在，创建文件夹')
    os.mkdir(folder_path)
#####################



##########################定位全部img，获取src
#定位全部img
img_list=driver.find_elements(By.CLASS_NAME,'')
#遍历
for i in range(len(img_list)):
    print(str(i))
    #########获取图片src
    img=img_list[i].get_attribute("src")
    headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
    }
    #########请求资源
    response = requests.get(img, headers=headers,timeout=(5,5))
    #########得到资源内容
    content=response.content
###########################



###########################根据content，保存文件
file_name='1.jpg'
#获取python文件路径，加上文件名，合成绝对路径
file_path=os.path.join(os.getcwd()+file_name)
with open(file_path, 'wb') as f:
    f.write(content)
    time.sleep(0.5)
###########################