Python爬取公交线路信息及站点shp数据 文末附数据下载地址

本文详细记录了使用Python爬取公交线路及站点信息的过程,包括解决GB2312转码问题、区分上下行站点、以及获取GPS坐标数据等挑战。最终,数据被整理成CSV表格并提供了20个城市公交站点的shp矢量数据下载链接。
摘要由CSDN通过智能技术生成

 本篇主要记录爬取公交网整个过程,由于这次所用方法虽比较常规,但由于该网站页面内容转码原因以及遍历链接较多,所以小坑还是比较多的,特在此进行记录。

以前爬过百度地图,当时用的是API平台,加上网站比较规范,所以标签节点什么的都比较清晰,但这次由于特殊原因所选择的网站为公交网,废话不多说直接开始吧。

网站主页:www.xbus.cn

操作环境为

  • window 8

  • python 3.6

  • Jupyter Notebook

  • re requests lxml pandas time os urllib

调用的库(这次不用截图了,用代码块更清楚一些):

 1import requests
 2import csv
 3import time 
 4import pandas as pd
 5import re
 6from lxml import etree
 7import urllib
 8import os
 9from IPython.core.interactiveshell import InteractiveShell
10InteractiveShell.ast_node_interactivity = 'all'

一、首先打开

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YXGiser

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值