有一分热,发一分光,爬取鲁迅先生《经典语录》

本文讲述了如何使用Python从"好句子迷"网站抓取鲁迅先生的经典语录,通过request模块获取网页,XPath解析内容,最终将数据保存到Excel文件中,供读者深入阅读。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

 

前言

《后浪》看的人热血沸腾。B站版本视频的底部,评论最多的一段话之一便是鲁迅先生这句。

“愿中国青年都摆脱冷气,只是向上走,不必听自暴自弃者流的话。能做事的做事,能发声的发声。有一分热,发一分光,就令萤火一般,也可以在黑暗里发一点光,不必等候炬火。”

本文通过“好句子迷”网站,获取了鲁迅先生的大部分经典语录,并保存到了本地excel文件,这些发人深省的句子真的该好好读一读。

用到的模块

 
import requests
from lxml import etree
import pandas as pd
import time

获取数据:

 

 

通过“好句子迷”网站,获取网页。

利用request模块,通过URL链接,获取html网页,下一步进行网页分析。

其中,URL只有最后一部分发生改变(1-10 :代表第1页--第10页的全部内容)

 

                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值