12306车站信息爬取（1）——输入条件的判断，包括出发站，到达站，和出发时间，并获取车次信息的链接

最新推荐文章于 2024-07-08 14:21:22 发布

橘子女侠

最新推荐文章于 2024-07-08 14:21:22 发布

阅读量3.6k

点赞数 9

分类专栏： python爬虫 Python爬虫——12306车票信息查询

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38684504/article/details/85095613

版权

本文介绍了如何爬取12306网站上的车次信息，包括判断出发站、到达站的代码以及验证出发日期的合理性，最终获取车次信息的链接。作者分享了通过分析网页源代码获取车站信息，以及设置日期范围验证的代码示例。

摘要由CSDN通过智能技术生成

12306车站信息的爬取是一个比较复杂的系统，爬取需要的信息不是很难，但是要将最终的结果做的完善和美观却不是那么容易。作为一个学习Python的新手，我想把练习和整理结合起来，希望大家可以相互交流和探讨。

这个项目准备花如下几个部分完成：

输入条件的判断，包括出发站，到达站，和出发的时间，获取车次信息的链接；
在上一步的基础上，获取输入出发站，到达站，和出发时间的车次信息；
将输出的结果美化，使用prettytable模块和colorama模块完成美化；
添加车票的票价信息；
在进行学习；

12306车站信息爬取（1）——输入条件的判断，包括出发站，到达站，和出发时间，并获取车次信息的链接

12306车站信息爬取（2）——输入出发站，到达站和出发时间，获取车次信息的列表

12306车站信息爬取（3）——使用prettytable模块和colorama模块使输出结果美化

12306车站信息爬取（4）——添加车票的票价的信息

在这篇文章中，我要实现的就是第一步的功能，输入条件的判断，包括出发站，到达站，和出发的时间，获取车次信息的链接；

1. 出发站，到达站的判断：

在判断之前，我们需要对我们最终要获取的链接进行分析：我们最终要获取的这个链接也就是直接可以爬取车次的信息的链接。我们可以看出链接中有出发时间，出发站的代码，和到达站的代码，所以，我们就需要获取这几个信息。

首先，我们进入12306的官网，点击右键——>查看网页源代码——>按Ctrl+F进行搜索——>搜索version——>找到station version的那个信息，打开。

进入那个页面后，我们可以看到许多的车站信息，其中就包括全拼，简拼，代码等信息。找到这个页面后，我们就是要获取这个页面的信息，然后将我们需要的部分信息获取出来。如下如所示。

将获取的数据进行分析可以发现，以@进行分析之后，第一项不是我们需要的信息，还有最后一项的两个字符，我们应该对字符串进行整齐化的处理，将我们需要的信息筛选出来。

如下代码为

最低0.47元/天解锁文章

关注

9
点赞
踩
19

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。