selenium 自动刷新博客浏览量

Gangjian_think

于 2021-03-27 00:19:50 发布

阅读量988

点赞数 1

分类专栏： selenium 文章标签： selenium python random chrome

本文链接：https://blog.csdn.net/Gangjian_0914/article/details/115258108

版权

selenium 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

selenium 自动刷新浏览量


from selenium import webdriver
import requests
import time
import random

requests.packages.urllib3.disable_warnings()


def get_html_text():
    driver = webdriver.Chrome()
    art_url = "https://blog.csdn.net/Gangjian_0914?spm=1003.2020.3001.5343"
    driver.get(art_url)
    article_num_path = '//*[@id="floor-user-profile_485"]/div/div[1]/div[2]/div[3]/ul/li[2]/a/div[1]'
    article_num = driver.find_element_by_xpath(article_num_path).get_attribute('innerText')
    print("你有 %s 篇 博客！" % article_num)

    """
    方法一： for循环 1-> n 依次 遍历所有的 子篇 博客
    """
    for i in range(1,int(article_num)+1):
        # article_url_path = '//*[@id="floor-user-profile_485"]/div/div[2]/div/div[2]/div/div[2]/div/article[{}]/a'
        article_url_path = '//*[@id="floor-user-profile_485"]/div/div[2]/div/div[2]/div/div[2]/div/div/div[{}]/article/a'
        url_redir = driver.find_element_by_xpath(article_url_path.format(str(i)))
        url_redir.click()
        print("当前刷新到 第 %s 条 博客！" % i)
        time.sleep(3)
        driver.refresh()
        t = random.randint(10,30) # 页面停留时间随机，防止被和谐
        print("停留时间 %s s!" % t)
        time.sleep(t)


    """
    方法二：随机选取 子篇 博客进行刷新  (建议使用随机刷新)
    for num in range(1, 50):
        i = random.randint(1, int(article_num) + 1)
        article_url_path = '//*[@id="floor-user-profile_485"]/div/div[2]/div/div[2]/div/div[2]/div/div/div[{}]/article/a'
        url_redir = driver.find_element_by_xpath(article_url_path.format(str(i)))
        url_redir.click()
        print("当前刷新到 第 %s 条 博客！" % i)
        time.sleep(3)
        driver.refresh()
        t = random.randint(10, 30)  # 页面停留时间随机，防止被和谐
        print("停留时间 %s s!" % t)
        time.sleep(t)

    """
    # if i == article_num:
    driver.quit()


get_html_text()

Gangjian_think

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
4
评论
selenium 自动刷新博客浏览量

selenium 自动刷新浏览量from selenium import webdriverimport requestsimport timeimport randomrequests.packages.urllib3.disable_warnings()def get_html_text(): driver = webdriver.Chrome() art_url = "https://blog.csdn.net/Gangjian_0914?spm=1003.20
复制链接

扫一扫