在处理Excel数据时,有时需要将某列数据拆分为单独个体,分行存储。手动操作过于麻烦,用Python的pandas库可以轻松解决。
例如下图是公交车站数据,每个车站存储着所经过线路名称。现在想从城市所有车站数据中提取城市所有线路数据,就可以通过pandas的stack函数实现。
import pandas as pd
bussta = pd.read_excel('200m公交数据.xlsx')
bussta.head()
使用stack粗暴地拆开:
a = bussta['address'].str.split(';',expand=True).stack().reset_index()
a