Python爬取公交线路信息及站点shp数据文末附数据下载地址

最新推荐文章于 2024-09-05 09:14:57 发布

YXGiser

最新推荐文章于 2024-09-05 09:14:57 发布

阅读量366

点赞数

分类专栏：基础地理数据分享文章标签： python 开发语言

本文链接：https://blog.csdn.net/2301_80730841/article/details/134332585

版权

基础地理数据分享专栏收录该内容

10 篇文章 10 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细记录了使用Python爬取公交线路及站点信息的过程，包括解决GB2312转码问题、区分上下行站点、以及获取GPS坐标数据等挑战。最终，数据被整理成CSV表格并提供了20个城市公交站点的shp矢量数据下载链接。

摘要由CSDN通过智能技术生成

本篇主要记录爬取公交网整个过程，由于这次所用方法虽比较常规，但由于该网站页面内容转码原因以及遍历链接较多，所以小坑还是比较多的，特在此进行记录。

以前爬过百度地图，当时用的是API平台，加上网站比较规范，所以标签节点什么的都比较清晰，但这次由于特殊原因所选择的网站为公交网，废话不多说直接开始吧。

网站主页：www.xbus.cn

操作环境为

window 8
python 3.6
Jupyter Notebook
re requests lxml pandas time os urllib

调用的库（这次不用截图了，用代码块更清楚一些）：

 1import requests
 2import csv
 3import time 
 4import pandas as pd
 5import re
 6from lxml import etree
 7import urllib
 8import os
 9from IPython.core.interactiveshell import InteractiveShell
10InteractiveShell.ast_node_interactivity = 'all'

一、首先打开