爬虫小白入门实例 —— 爬取全国某天所有火车的运行时刻表

最新推荐文章于 2024-04-18 00:19:35 发布

竹竹竹～

最新推荐文章于 2024-04-18 00:19:35 发布

阅读量5.7k

点赞数 4

分类专栏： python爬虫文章标签： python爬虫 PyQuery

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lezhuximing/article/details/88044796

版权

本文是Python爬虫初学者的实战案例，讲述了如何爬取全国某天所有火车运行时刻表。通过学习《Requests快速上手》和《PyQuery基本使用》，了解爬取和解析网页的基本流程。分享了实现任务的代码，并针对可能出现的问题提供了解决方案，帮助读者快速入门爬虫。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

受好朋友的委托，帮忙爬取全国某天所有火车的运行时刻表。

在此之前没有用过爬虫，但是会用python，所以迅速学习了一下。

把自己的学习过程整理如下，爬虫小白可以通过下述内容快速入门。

任务描述：

爬取的站点：http://search.huochepiao.com/chaxun/resultc.asp?txtCheci=D2&cc.x=0&cc.y=0

希望能把当前运行的所有车次的时刻表，都导出到excel变成下面这样。

学习及爬取过程如下：

快速浏览了《Requests 快速上手》，链接如下：

http://docs.python-requests.org/zh_CN/latest/user/quickstart.html

然后可以继续快速浏览《python爬虫之PyQuery的基本使用》，链接如下：

https://www.cnblogs.com/lei0213/p/7676254.html

第一个链接的目的是为了学习把网页内容爬到本地，第二个链接的内容是学习如何解析爬到本地的网页，进而从爬到的众多信息里提取挖掘出我们需要的信息。

所以总结一下，简单的爬虫就分为两个部分，第一是爬取网页到本地，第二是解析网页。

有了前面的基础知识，可以使用下面的代码来完成上面的爬取任务，读懂下面代码的内容，自己动手实践一下，那么简单的爬虫就入门了。

具体代码如下：

#!/usr/bin/python3
# coding: utf-8
import requests
from pyquery import PyQuery as pq
i

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。