python-爬取古诗文网古诗

最新推荐文章于 2024-06-13 11:18:37 发布

qq_45776928

最新推荐文章于 2024-06-13 11:18:37 发布

阅读量868

点赞数

本文链接：https://blog.csdn.net/qq_45776928/article/details/105281440

版权

本文介绍了如何使用Python爬虫技术从古诗文网站上抓取古诗数据，包括选择合适的库，解析HTML，处理翻页和数据存储等步骤。

摘要由CSDN通过智能技术生成

标题：爬取古诗文网古诗

# encoding=utf-8
import requests
import re

# 请求数据
def parse_page(url):
    headers = {
   
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari'
                     '/537.36 Core/1.70.3756.400 QQBrowser/10.5.4039.400'
}
    response = requests.get(url,headers)
    text = response.text
    # 注： . 是匹配不到 \n 的
    # 注： DOTALL 匹配所有的字符
    titles = re.findall(r'<div\sclass="cont">.*?<b>(.*?)<b>',text,re.DOTA

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_45776928

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python-爬取古诗文网古诗

标题：爬取古诗文网古诗# encoding=utf-8import requestsimport re# 请求数据def parse_page(url): headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Ch...
复制链接

扫一扫