利用python爬取城市公交站点
页面分析
https://guiyang.8684.cn/line1
爬虫
我们利用requests请求,利用BeautifulSoup来解析,获取我们的站点数据。得到我们的公交站点以后,我们利用高德api来获取站点的经纬度坐标,利用pandas解析json文件。接下来开干,我推荐使用面向对象的方法来写代码。
import requests import json from bs4 import BeautifulSoup import pandas as pd class bus_stop: ## 定义一个类,用来获取每趟公交的站点名称和经纬度 def __init__(self): self.url = 'https://guiyang.8684.cn/line{}' self.starnum = [] for start_num in range(1, 17): self.starnum.append(start_num) self.payload = {} self.headers = { 'Cookie': 'JSESSIONID=48304F9E8D55A9F2F8ACC14B7EC5A02D'} ## 调用高德api获取公交线路的经纬度 ### 这个key大家可以自己去申请 def get_l