selenium 自动 刷新浏览量
from selenium import webdriver
import requests
import time
import random
requests.packages.urllib3.disable_warnings()
def get_html_text():
driver = webdriver.Chrome()
art_url = "https://blog.csdn.net/Gangjian_0914?spm=1003.2020.3001.5343"
driver.get(art_url)
article_num_path = '//*[@id="floor-user-profile_485"]/div/div[1]/div[2]/div[3]/ul/li[2]/a/div[1]'
article_num = driver.find_element_by_xpath(article_num_path).get_attribute('innerText')
print("你有 %s 篇 博客!" % article_num)
"""
方法一: for循环 1-> n 依次 遍历所有的 子篇 博客
"""
for i in range(1,int(article_num)+1):
# article_url_path = '//*[@id="floor-user-profile_485"]/div/div[2]/div/div[2]/div/div[2]/div/article[{}]/a'
article_url_path = '//*[@id="floor-user-profile_485"]/div/div[2]/div/div[2]/div/div[2]/div/div/div[{}]/article/a'
url_redir = driver.find_element_by_xpath(article_url_path.format(str(i)))
url_redir.click()
print("当前刷新到 第 %s 条 博客!" % i)
time.sleep(3)
driver.refresh()
t = random.randint(10,30) # 页面停留时间随机,防止被和谐
print("停留时间 %s s!" % t)
time.sleep(t)
"""
方法二:随机选取 子篇 博客进行刷新 (建议使用随机刷新)
for num in range(1, 50):
i = random.randint(1, int(article_num) + 1)
article_url_path = '//*[@id="floor-user-profile_485"]/div/div[2]/div/div[2]/div/div[2]/div/div/div[{}]/article/a'
url_redir = driver.find_element_by_xpath(article_url_path.format(str(i)))
url_redir.click()
print("当前刷新到 第 %s 条 博客!" % i)
time.sleep(3)
driver.refresh()
t = random.randint(10, 30) # 页面停留时间随机,防止被和谐
print("停留时间 %s s!" % t)
time.sleep(t)
"""
# if i == article_num:
driver.quit()
get_html_text()