书接上回,到了可视化的部分,先回顾一下原数据表结构,数据标签包括:公交线路名称、始发站、终点站、行车区间、全程长度、途径站点名、途径站点坐标、途径站点第几站这几个标签,然而做可视化并不需要这么多标签,我选取了line_name、station_name、station_coords和station_sequence,这4个标签;
接下来就是从这个csv里面提取这个四个标签,并按一定规则排列,比如说这样;
遂写了个小脚本,完整代码如下。PS:读取路径改成自己的,不想加前缀就把文件放在.py下,输出路径也可以改成自己的,不改的话也可以,whatever~
#运行环境 Python 3.11
import pandas as pd
from ast import literal_eval
# 读取CSV文件
df = pd.read_csv('深圳公交基本信息.csv', encoding='utf-8') # 替换为你的CSV文件路径
# 使用literal_eval将字符串列表转换为Python列表
df['station_name'] = df['station_name'].apply(literal_eval)
df['station_coords'] = df['station_coords'].apply(literal_eval)
df['station_sequence'] = df['station_sequence'].apply(literal_eval)
# 初始化一个空的列表来存储每个站点的对应关系
correspondences = []
# 遍历DataFrame的每一行
for index, row in df.iterrows():
# 遍历站点名称、坐标和序列号列表
for station_name, station_coord, station_sequence in zip(row['station_name'], row['station_coords'],
row['station_sequence']):
# 添加对应关系到列表中
correspondences.append({
'line_name': row['line_name'],
'station_name': station_name,
'station_coords': station_coord, # 这里station_coord已经是单个坐标字符串
'station_sequence': station_sequence
})
# 将列表转换为DataFrame
df_correspondences = pd.DataFrame(correspondences)
# 显示结果
print(df_correspondences)
# 保存为.xlsx文件
df_correspondences.to_excel('new_excel_file.xlsx', index=False) # 替换为你想要保存的文件路径
就得到上面想要的结果了,导出数据类型为.xlsx,至于为什么不直接导出csv,额,因为我导出来乱码,虽然声明了编码,还有一个就是坐标没分列,所以手动分列并另存为csv或者xls都可以。
至此完成前期数据格式出来,接下来就是数据可视化了,这里用到arcgis 10.8,实现流程按我下面这篇博客就okay。(第一次引用自己的博客ヾ(◍°∇°◍)ノ゙)
Arcgis将站点按一定规则连线_gis中怎么把点按顺序连成线-CSDN博客
然后就是数据验证:
最后结果展示: