python爬虫学习7：读取起点排行榜数据_怎么判断爬虫起点排行榜-CSDN博客

本文链接：https://blog.csdn.net/weixin_43788986/article/details/125590971

本文介绍了一种使用Python爬取起点中文网月票排行榜小说信息的方法，并将数据保存为CSV文件的过程。通过正则表达式提取了小说名称、作者等关键信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第一步打开起点月票排行榜：

https://www.qidian.com/rank/yuepiao/

F12查看源代码或者右键点击查看源代码，可以看到代码：

然后根据正则表达式去获取信息，代码如下：

import requests
import re
import csv
from fake_useragent import UserAgent
url = "https://www.qidian.com/rank/yuepiao/"
headers= {'User-Agent':str(UserAgent().random)}
resp = requests.get(url, headers=headers)
page_content = resp.text

# 解析数据
qidian = re.compile(r'最新章节在线阅读">(?P<name>.*?)</a></h2> <p class="author">.*?data-eid=".*?">(?P<renname>.*?)</a><em>'
                    r'.*?em><span>(?P<state>.*?)</span> </p> <p class="intro">(?P<tell>.*?)</p> <p class="update">', re.S)# re.S: 让.能匹配换行符

# 开始匹配
result = qidian.finditer(page_content)
f = open("qiandian.csv", mode="w")
csvwriter = csv.writer(f)
for it in result:
     print(it.group("name"))
     print(it.group("renname"))
     print(it.group("state"))
     print(it.group("tell"))
     dic = it.groupdict()
     csvwriter.writerow(dic.values())

f.close()
print("over!")