爬取某市的公交路线站点

本文介绍了如何使用爬虫技术,通过requests库获取某市公交线路的详细信息。首先创建类,然后定义get_tree()函数方便调用。接着,获取城市的所有线路链接,再深入获取每条线路的详细站点链接。最后,解析每个站点的详细信息并存储为字典列表。运行程序后,得到了完整的公交线路站点数据。
摘要由CSDN通过智能技术生成

创建类

在这class Gongjao8684(object):
	def __init__(self,url):
		self.url=url
		self.all_gj_list=[]
		self.filename=(urlsplit(self.url)[1]).split('.')[0]

get_tree(url)函数,便于调用

def get_tree(selfj,url):
		headers={
	'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
	}
		r = requests.get(url,headers=headers)
		tree=etree.HTML(r.text)
		return(tree)

获取城市的总线路

def get_gj_route(self,url):
		tree=self.get_tree(url)
		find_gj_number=tree.xpath("//div[@class='bus_kt_r1']/a/@href")
		find_gj_zimu=tree.xpath("//div[@class='bus_kt_r2']/a/@href")

获取各数字或字母开头的线路总链接

def get_zhitou_gj(self,gj_list):
		for g_url in gj_list:
			g_url=self.url+g_url
			self.get_all_zhitou(g_url)
		
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值