python输出古诗词_python爬虫——爬取古诗名句

最新推荐文章于 2022-10-24 16:11:53 发布

weixin_39611510

最新推荐文章于 2022-10-24 16:11:53 发布

阅读量893

点赞数

文章标签： python输出古诗词

这篇博客介绍了一个Python爬虫项目，用于循环爬取古诗词网站的名句，并将其存储到本地数据库。通过firedebug分析页面结构，使用lxml库的etree解析HTML，定位到古诗内容和来源，最后将数据保存到数据库。

摘要由CSDN通过智能技术生成

一. 概要

1.通过python爬虫循环爬取古诗词网站古诗名句

2.落地到本地数据库

二. 页面分析

首先通过firedebug进行页面定位：

AAffA0nNPuCLAAAAAElFTkSuQmCC

其次源码定位：

AAffA0nNPuCLAAAAAElFTkSuQmCC

最终生成lxml etree定位div标签源码：

response = etree.HTML(data)

for row in response.xpath('//div[@class="left"]/div[@class="sons"]/div[@class="cont"]'):

content = row.xpath('a/text()')[0]

origin = row.xpath('a/text()')[-1]

self.db.add_new_row('mingJuSpider', {'content': content, 'origin': origin, 'createTime': str(date.today())})

三. 执行结果

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注