(本文写给python初学者.)
在中午和晚上空闲的时候, 想写一个公交换乘的东西.
从头来吧.
取得数据
选择的数据来源,当然是合肥公交集团网站(http://hfbus.cn/). 这个网站访问很慢.
如何取得全部的公交路线? 很简单, 直接点击"线路查询", 所有的线路就出来了(相当的慢, 我觉得是数据库的原因).
本打算写个小爬虫,后来觉得划不来, 干脆手工copy页面内容吧,也就24页...
格式是这样:
不怎么好看的数据, 处理文本是python的强项.
把文件保存为utf-8编码, 别用notepad, 用点高级货(edit plus, ultraedit...).
了解一下python读文件的方式
仔细观察一下原始数据的格式, 5行可以为一个单位......
嘿嘿, range(0, lines_len, 5), 从头到尾, 每隔5行作为一个单位.
我的原则, 先写出来,逐渐oo. 本来python就是很不oo的oopl...
那就定义一个结构, 来表示这5行的内容...
差不多这样了.
下面就简单的分析了:
这些处理过的数据存在哪里? 随便了...反正我是存在文本里.
下一步就是分析数据了..