通过Python+Selenium查询文章质量分

前言

通过Python+Selenium查询文章质量分
质量分查询地址

大家好,我是空空star,本篇给大家分享一下《通过Python+Selenium查询文章质量分》

一、环境准备

浏览器:本篇使用的是Chrome
Chrome驱动版本:110.0.5481.77
Python版本:Python3.8
selenium版本: 4.8.2
Selenium基础篇之环境准备

二、查询文章质量分

1.引入模块

import pprint
import time
from selenium import webdriver
from selenium.webdriver.common.by import By

2.引入浏览器配置

options = webdriver.ChromeOptions()

3.设置无头模式

options.add_argument(‘–headless’)

4.启动浏览器实例,添加配置信息

driver = webdriver.Chrome(options=options)

5.访问质量分地址

driver.get(‘https://www.csdn.net/qc’)

6.窗口最大化

driver.maximize_window()

7.定位到输入框并输入博文地址

driver.find_elements(By.CLASS_NAME, ‘el-input__inner’)[0].send_keys(blog_url)

8.定位到查询按钮并点击

driver.find_elements(By.CLASS_NAME, ‘trends-input-box-btn’)[0].click()

9.强制等待1s

time.sleep(1)

10.获取博文标题

title = driver.find_elements(By.TAG_NAME, ‘span’)[3].text

11.获取博文发布时间

posttime = driver.find_elements(By.TAG_NAME, ‘span’)[4].text

12.获取博文质量分

score = driver.find_elements(By.TAG_NAME, ‘p’)[1].text

13.获取博文质量分建议

remark = driver.find_elements(By.TAG_NAME, ‘p’)[2].text

14.打印结果

pprint.pprint({‘title’: title, ‘posttime’: posttime, ‘score’: score, ‘remark’: remark, ‘url’: blog_url})

15.效果

{‘posttime’: ‘- 空空star · 2023-05-16 18:35:51 -’,
‘remark’: ‘文章质量良好’,
‘score’: ‘85’,
‘title’: ‘通过Python的wordcloud库将单词生成词云(心形形状)’,
‘url’: ‘https://blog.csdn.net/weixin_38093452/article/details/130704860’}
Process finished with exit code 0

三、代码

def qc(blog_url):
    options = webdriver.ChromeOptions()
    options.add_argument('--headless')
    driver = webdriver.Chrome(options=options)
    driver.get('https://www.csdn.net/qc')
    driver.maximize_window()
    driver.find_elements(By.CLASS_NAME, 'el-input__inner')[0].send_keys(blog_url)
    driver.find_elements(By.CLASS_NAME, 'trends-input-box-btn')[0].click()
    time.sleep(1)
    title = driver.find_elements(By.TAG_NAME, 'span')[3].text
    posttime = driver.find_elements(By.TAG_NAME, 'span')[4].text
    score = driver.find_elements(By.TAG_NAME, 'p')[1].text
    remark = driver.find_elements(By.TAG_NAME, 'p')[2].text
    pprint.pprint({'title': title, 'posttime': posttime, 'score': score, 'remark': remark, 'url': blog_url})
    return {'title': title, 'posttime': posttime, 'score': score, 'remark': remark, 'url': blog_url}

总结

单篇查询文章质量分至此结束,下一篇介绍《如何快速获取作者所有文章的质量分并保存到excle》。

  • 18
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 24
    评论
评论 24
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

空空star

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值