结果:输出json文件,格式如下图
代码:
# coding=utf-8
import requests
from bs4 import BeautifulSoup
import json
import importlib,sys
importlib.reload(sys)
"""
目标:爬取中国大陆地铁线路信息
要求:
①获取相关城市的地铁数量
②获取每个地铁站的名称
③写入文档
"""
JSON = []
province = []
class Subway(object):
def __init__(self):
# 构造url
self.url = "http://map.amap.com/subway/index.html?&1100"
# 使用老版本请求头
self.headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}
# 获取数据
def get_data(self):
responses = requests.get(url=self.url, headers=self.headers)
# 返回str字符串类型
return res