python爬取唐诗

最新推荐文章于 2024-10-23 00:26:30 发布

月爷冲

最新推荐文章于 2024-10-23 00:26:30 发布

阅读量1.8k

点赞数 2

文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/qq_56256779/article/details/122815479

版权

这篇博客讲述了如何使用Python爬虫从诗词名句网获取唐诗三百首的资料。作者通过分析网页结构，发现诗的人物介绍位于<div class='list_num_info'>标签内，而诗的内容在<div class='shici_list_main'>中。通过soup.find_all()方法提取所需信息，并利用pandas.DataFrame进行数据存储。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

唐.唐诗三百首(306首)_诗词分类_诗词名句网 https://www.shicimingju.com/shicimark/tangshisanbaishou_1_0__1.html在这个网站上爬

https://www.shicimingju.com/shicimark/tangshisanbaishou_2_0__1.html

一共有16页，所以url为

for i in range(1, 17):
    url = 'http://www.shicimingju.com/shicimark/tangshisanbaishou_' + str(i) + '_0__0.html'

import requests
from bs4 import BeautifulSoup


url = 'http://www.shicimingju.com/shicimark/tangshisanbaishou_1_0__0

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

月爷冲

关注关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python获取的唐诗三百首数据库

05-28

唐诗三百首数据库

python爬取唐诗三百首

qq_42680814的博客

03-04

4921

python讨论qq群：996113038导语：最近一直在写爬虫，写过一些爬取“妹子图”，“小视频”之类的爬虫，但是我想了想。咱们公众号虽然是个技术类公众号。但是总得有点文艺气息。所以这...

2 条评论您还未登录，请先登录后发表或查看评论

python爬取唐诗300首的诗名和对应的诗人存为Excel

Forerunner and Successor

02-17

4645

今天，又为了生活而奔波，干了一天的苦力。测试通话是否正常，耳朵都快测废了，明天还有一天。虽然深度学习没有精力搞不了，但是不编程是不可能的，这辈子都不可能不编程。编个爬虫顺便跟大家分享一波python爬取数据存入Excel的操作。废话不多说，上代码开干！！ import requests import os import re import time import xlwt """ #encoding="utf-8" @Author:Mr.Pan_学狂 finish_time:2022/2/17 23:

Python小工具——唐诗三百首朗读

weixin_39151703的博客

02-20

1360

Python小工具——唐诗三百首朗读工具简介系统语音朗读唐诗三百首，可自己选择要朗读的唐诗，可搜索查找唐诗进行朗读，可用于幼儿园或小学生熟悉唐诗，积累文学素养。工具界面 1、打开工具可查看当前朗读的唐诗标题及内容，可点击播放朗读。 2、可点击上一首或下一首更换内容 3、可在数字框内输入数字，选择相应的唐诗，点击刷新进行更换。 4、可查找唐诗主要代码 1、系统语音阅读 import winsound import win32com.client speak_out = win32com.cli

Python爬虫之诗歌接龙

weixin_34010949的博客

10-18

328

介绍本文将展示如何利用Python爬虫来实现诗歌接龙。该项目的思路如下：利用爬虫爬取诗歌，制作诗歌语料库；将诗歌分句，形成字典：键（key）为该句首字的拼音，值（value）为该拼音对应的诗句，并将字典保存为pickle文件；读取pickle文件，编写程序，以exe文件形式运行该程序。该项目实现的诗歌接龙，规则为...

Python 爬取唐诗宋词三百首

热门推荐

本博客暂停使用

06-02

1万+

看到一个有意思的题目，可以玩一下正则、统计、jieba，花了几个小时写好完善了下，本文只讲测试案例和注意点，代码在仓库中，欢迎star后拉一下：）~

通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首

09-09

通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首

python爬取网站上所有诗句（第三版）

人生苦短，我用python

02-26

1070

#-*-coding:utf8-*- import requests import re # 获取网页源代码 kv = {'user-agent':'Mozilla/5.0'} url = 'http://www.shicimingju.com/shicimark/qixijie.html' html = requests.get(url, headers=kv) poem = re.fin...

Python实战案例-写唐诗

王斯的博客

11-22

1019

安装模块 pip3 uninstall gensim # 这里如果没有安装着不需要卸载 pip3 install gensim==3.8.1 导入模块

唐诗三百首

weixin_34064653的博客

04-26

380

寻隐者不遇《寻隐者不遇》 - 唐代·贾岛松下问童子，言师采药去。只在此山中，云深不知处。译文我在苍松下询问年少童子；他说师父已经到山中采药去了。就在这座山里，可是山中云雾缭绕，不知道他的行踪。注释寻：寻访。隐者：隐士，隐居在山中的人。古代指不肯做官而隐居在山野之中的人。一般指的是贤士。不遇：没有遇到，没有看见。童子：没有成年的人，小孩。在这里是指隐者的弟子、学生。言：回...

Python 分析样例｜文本整理案例：《全唐诗》文本整理

长行

05-15

5131

在整理《全唐诗》的文本之前，我们首先需要完成以下两个步骤：确定需求了解文本在完成以上步骤后，我们开始实际着手整理文本，在整理的过程中大体上也包含两个流程：文本解析结果输出全唐诗文本语料在“全唐诗.txt”文件中，请参考语料阅读以下内容。确定需求我们计划将《全唐诗》中的每一首诗的各种信息分别提取出来，并转存为csv的形式。根据对文本的初步了解，我们发现我们需要提取的信息（即绝大部分诗文都包含的共性信息）包括：诗文的所属的卷编号（后简称卷编号）诗文的在当前卷中的序号（后

爬虫爬取唐诗三百首

qq_52149882的博客

04-11

1151

爬虫爬取唐诗三百首

别样的唐诗宋词汇——基于Python的量化分析挖掘尝试

Together_CZ的博客

04-12

2386

提起唐诗宋词，想必所有人都不会陌生，这些内容陪伴了我们走过了那个曾经的青春岁月啊，最近接触到了一个关于唐诗宋词的分析挖掘问题，自己从不同的角度做了一些尝试，这里简单分享一些，能够做的还有很多，欢迎大家继续尝试。我用到数据来自于这个项目，感谢作者的努力付出。可以自行下载项目获取所需的数据集，我的数据集如下：接下来简单看下对应的数据样例，首先看下唐诗的样例：接下来是宋词的样例，如下所示： ...

python函数格式化输出唐诗《锦瑟》_Python文本分析案例：近体诗格律分析

weixin_35682010的博客

01-29

2420

作者：长行时间：2020.05.26Github原文：Week-03/Example-0301在这个案例中，我们将要实现近体诗格律的分析。具体的，我们从如下角度分析近体诗的格律：诗句数量、诗句字数是否符合近体诗的要求，即是否为五绝、七绝、五律、七律中的一种(暂不考虑排律、六言的情况)是否押了平声韵，所押的韵脚是什么平水韵部(暂不考虑首句押韵的情况)诗句是否有拗句，是否存在孤平和拗救的情况诗文是否符...

【Python爬虫课程设计】爬取唐诗三百首+数据可视化

m0_62283350的博客

06-26

3652

通过编写爬虫程序，我们从指定的网站中爬取了唐诗三百首的相关信息，包括题目、作者、内容等。这为后续的数据处理和可视化分析提供了数据基础。我们对爬取到的数据进行了清洗和整理，去除了冗余信息，确保了数据的准确性和一致性。这使得我们能够处理干净、规范的数据集。清洗后的数据被存储到CSV文件中。这样，我们可以方便地访问和管理唐诗数据，并为后续的数据可视化处理提供了便利。如果你也喜欢编程，想通过学习Python获取更高薪资，这里给大家分享一份Python学习资料。👉Python所有方向的学习路线👈。

python爬虫爬取唐诗

09-11

如果您想用 Python 爬虫爬取唐诗，可以使用 requests 和 BeautifulSoup 库。以下是一个简单的示例代码，可供参考： ```python import requests from bs4 import BeautifulSoup url = ...