爬虫学习笔记：爬取古诗文网

最新推荐文章于 2024-07-31 14:30:10 发布

明的大世界

最新推荐文章于 2024-07-31 14:30:10 发布

阅读量1.4k

点赞数 1

分类专栏：代码专区爬虫文章标签： python

本文链接：https://blog.csdn.net/maxMikexu/article/details/105417973

版权

1、目标网站

目标网站：https://so.gushiwen.org/shiwen/default.aspx?

2、爬虫目的

爬取目标网站的文本，如古诗的内容，作者，朝代，并且保存到本地中。

3、爬虫程序

# -*- coding:utf-8 -*-
#爬取古诗网站
import requests
import re

#下载数据
def write_data(data):
    with open('诗词.txt','a')as f:
        f.write(data)

for i in range(1,10):
    #目标url地址
    url =  "https://so.gushiwen.org/shiwen/default.aspx?page={}".format(i)
    headers={'User-Agent': 'Mozilla/5.0 (X11; L

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

明的大世界

关注关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
爬虫学习笔记：爬取古诗文网

1、目标网站目标网站：https://so.gushiwen.org/shiwen/default.aspx?2、爬虫目的爬取目标网站的文本，如古诗的内容，作者，朝代，并且保存到本地中。3、爬虫程序# -*- coding:utf-8 -*-#爬取古诗网站import requestsimport re#下载数据def wr...
复制链接

扫一扫