python输出古诗词_python爬虫——爬取古诗词

最新推荐文章于 2024-03-20 10:35:39 发布

weixin_39847945

最新推荐文章于 2024-03-20 10:35:39 发布

阅读量1.6k

点赞数

文章标签： python输出古诗词

本文介绍了一个Python爬虫项目，用于抓取古诗词网站上的唐诗宋词，内容包括诗词的标题、朝代、作者、内容和标签，并将数据存储到本地数据库。文章详细讲解了页面分析和数据定位的方法。

摘要由CSDN通过智能技术生成

一. 概要

1.通过python爬虫循环爬取古诗词网站唐诗宋词

2.落地到本地数据库

二. 页面分析

首先通过firedebug进行页面定位：

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

其次源码定位：

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

最终生成lxml etree定位div标签源码：

# 通过 lxml进行页面分析

response = etree.HTML(data)

# div层定位

for row in response.xpath('//div[@class="left"]/div[@class="sons"]'):

# 标题定位

title = row.xpath('div[@class="cont"]/p/a/b/text()')[0] if row.xpath('div[@class="cont"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39847945

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python古诗词爬虫脚本

03-20

1、可以爬取全部古诗词内容 2、请勿用于非法用途 3、程序有屏蔽地方学习的话需要适量改动微调。

python输出古诗词_python爬虫——爬取古诗名句

weixin_39611510的博客

11-26

931

一. 概要1.通过python爬虫循环爬取古诗词网站古诗名句2.落地到本地数据库二. 页面分析首先通过firedebug进行页面定位：其次源码定位：最终生成lxml etree定位div标签源码：response = etree.HTML(data)for row in response.xpath('//div[@class="left"]/div[@class="sons"]/div[@cla...

参与评论您还未登录，请先登录后发表或查看评论

Python程序设计实战：输出古诗实战

热门推荐

qq_60481975的博客

05-22

1万+

** Python实战例题-demo1 ** 题目：利用Python实现输出一首古诗（“春眠不觉晓，处处闻啼鸟，夜来风雨声，花落知多少。），要求：使用Unicode 12288编码居中显示，填充长度为30位，且不带标点分行输出。程序分析： 1.先将古诗放入一个大的列表中。 2.使用for循环或者while循坏筛选出标点字符。 3.使用字符串的替换函数replace()将标点符号替换为空。 4.利用center()函数居中显示。代码如下： string=["春眠不觉晓，","处处闻啼鸟。","夜来风雨声，

python读取txt中的诗句并横板和竖版（从右至左）输出

qq_68537201的博客

04-22

1797

自行选择一首七言绝句，保存在10_3.txt中。txt文件编码应为ANSI，否则会出现乱码。用切片实现横板和竖版输出。10_3a.txt，竖版。程序读取文件后，实现。

（python）诗歌排版输出

weixin_74384492的博客

08-28

1596

利用for循环和if条件句进行初步排序，此次排序为横向正序。开头进行输入，n代表是几言诗，poem代表诗中所有的字。利用函数，对刚排好的横向正序变为横向逆序。输出，即第一句在最右，最后一句在最左。对横向逆序的目标进行转置操作。编程代码使输入的诗句。

用python打印诗词，三引号注释

weixin_61415339的博客

10-24

1202

用python打印诗词，三引号注释

用Python快速打印一首诗（换行小技巧）

kaylee7fan的博客

01-23

1140

用Python快速打印一首诗（换行小技巧）

Python爬虫获取古诗词网诗词给孩子学习

08-03

在IT行业中，Python爬虫是一种常见的技术，用于自动地从互联网上抓取数据。...通过这个项目，你不仅可以掌握Python爬虫的基本技能，还能了解到如何利用技术为教育提供便利，让孩子们能够接触到丰富的古诗词资源。

Python-最全中华古诗词数据库

08-10

【Python-最全中华古诗词数据库】是一个专为Python开发者设计的资源库，包含了丰富的中华古诗词数据。这个数据库特别注重唐宋两朝的诗词，提供了近一万四千位诗人的作品，总计约5.5万首唐诗和26万首宋诗，充分展现了...

开题报告雅韵古诗词系统python爬虫.docx

05-14

雅韵古诗词系统python爬虫本文主要介绍了雅韵古诗词系统的设计和实现，基于 Python 语言和爬虫技术。该系统的主要目的是收集和整理中国古典诗词，提供一个搜索和浏览古诗词的平台，为用户提供一个学习和欣赏中国...

python爬虫古诗词

06-18

python爬虫古诗文网站

Python爬虫实战(基础篇)—4获取古诗词给孩子学习(附完整代码)

weixin_42636075的博客

07-27

1722

python爬虫爬虫获取古诗词 python爬虫获取数据 python爬虫获取古诗词 搞定：

python编写程序输出诗句_编程小白是这样用python把唐诗玩坏的

weixin_39614262的博客

11-26

3261

最近对编程比较感兴趣，于是请教程序猿朋友们，最后都推荐我学习Python。翻看教程几天后，碰巧遇到有朋友在玩唐诗乱搭的游戏，于是我就写了一段python程序（对于能否叫程序我一直很怀疑），挑了了很多的混搭诗句，在朋友圈引吐嘈无数。用朋友的话来说，把唐诗给玩坏了！恶搞一下。图片来自：gomeart下面的诗句，都是由不同的诗篇中的句子组合起来的，你可以仔细地读一读。很好玩的是，它们几乎没有违和感！独在...

Python爬虫——爬取古诗词

奔跑的狮子

06-24

4075

🌸当你喜欢哪个诗人，想获取他的全部诗词数据的时候，可以通过爬虫来解决这个问题，用爬虫把诗词全部爬下来，然后存到txt文档中，打印出来背诵，岂不美哉。 🐟我们要爬取这个诗人的全部诗词和他的个人简介🐽先在该页面中获取诗人信息，但是该页面难以获取全部诗词内容，那么在该页面中先获取到诗词详细的，根据诗词详情页的再继续深一层爬取详情页信息，进而获取诗词内容代码如下（示例）：结果 🐡下面是程序运行的输出🐂下面是我们保存到txt文件的内容爬虫的基本步骤： 1.检查有没有反爬，设置常规反反爬，和都是最常见的反...

使用PyCharm编写Scrapy爬虫程序，爬取古诗词网站

欢迎来到我的小家

11-25

7727

有两种执行Scrapy爬虫的方法，第一种是在Terminal窗口中输入命令“scrapy crawl poemSpider”，然后回车运行，等待几秒钟后即可完成数据的爬取。在Terminal窗口输入命令“cd poemScrapy”，进入对应的爬虫工程中，再输入命令“scrapy genspider poemSpider gushiwen.cn”，这时，在spiders目录下会出现一个新的Python文件poemSpider.py，该文件就是我们要编写爬虫程序的位置。同级目录下生成的data.txt文件。

Python基础

m0_61178239的博客

09-18

793

python交互模式首先需要安装python环境进入命令窗口(window+r 输入CMD) 输入python进入交互模式输入数据,print输出数据使用pycharm进行操作创建项目创建Python文件，输出数据右键RUN执行提前封装一个python文件在命令窗口执行输入 input 在python交互模式下输出一首古诗在python交互模式下实现输出自己的名字在python交互模式下实现输入自己的年龄在python命令行模式下实现输出一个指...

python交互模式下输出一首古诗

jidada666的博客

09-18

3126

用Python爬取古诗文网的各类古诗

最新发布

mate1357的博客

03-20

892

可以拿去用于个人知识库、知识图谱的创建等其他学习用途。

python爬虫入门_3种方法爬取古诗文网站

purvispanwu的博客

06-19

4964

的机房ID撒发快递刷卡结构化大两居复健科古法

python爬虫爬取古诗词网

07-28

爬虫是一种按照一定规则，自动抓取万维网信息的程序或者脚本。它可以通过定义好的规则，自动抓取网络上的信息，并对抓取下来的数据进行筛选和提取，从而获得我们需要的信息。爬虫并不是Python的专利，使用其他编程语言也可以实现爬虫功能，但Python提供了许多方便的库，使得开发爬虫变得更加简单。\[1\] 在爬取古诗词网的例子中，使用了Python的requests库和BeautifulSoup库来进行网页请求和解析。首先，通过发送HTTP请求获取网页的HTML内容，然后使用BeautifulSoup库对HTML进行解析，提取出需要的信息，如标题、朝代、作者和内容。最后，将提取的信息存储到一个列表中，并将列表写入一个JSON文件中。\[2\] 另外，还可以使用XPath解析HTML内容。XPath是一种用于在XML和HTML文档中进行导航和提取信息的语言。在这个例子中，使用了Python的requests库和lxml库来进行网页请求和解析。通过XPath表达式，可以直接定位到需要的元素，并提取出相应的信息，然后将提取的信息存储到一个列表中，并将列表写入一个JSON文件中。\[3\] 总结来说，Python爬虫可以通过发送HTTP请求获取网页内容，然后使用相应的库对网页进行解析，提取出需要的信息，并进行存储和处理。这样就可以实现对古诗词网或其他网站的信息进行爬取。 #### 引用[.reference_title] - *1* [Python爬虫（一）——爬取古诗文网，初识什么是爬虫](https://blog.csdn.net/u014663232/article/details/103459450)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [python爬虫入门_3种方法爬取古诗文网站](https://blog.csdn.net/purvispanwu/article/details/106849214)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]