目前在做的项目需要统计不同月份电车的充电情况,想做成箱线图,看充电时间的分布情况,目前有的数据存在csv中,每个csv里存了一个月的数据。
思路大致如下:
1.每个csv转成DataFrame
2.提取出每个DataFrame表示充电时间的列,拼接成一个DataFrame
3.做盒图
遇到的问题是每个csv中充电的数据不一样多,这样选取的列包含的数据的数目就是不同的,解决办法是
可以先用Series函数将充电数据转换为Series数据,再存储到dataframe中,由于不同列的数目不相同,对应相同索引时,若不存在则为NaN
大致是这个样子的
from pandas import Series
import numpy as np
...此处省略读取文件的操作
c_1309 =list