怎样将不同Data Frame中几列数据拼成一个大dataFrame

该项目旨在统计不同月份电车的充电情况并绘制箱线图。首先将CSV文件转化为DataFrame,然后提取充电时间列并合并。面对数据量不一致问题,通过将充电时间转换为Series并填充NaN。最后,为了清晰展示分布,将数据限制在98%范围内,排除异常值,生成的箱线图能有效展示充电时间的统计特征。
摘要由CSDN通过智能技术生成

目前在做的项目需要统计不同月份电车的充电情况,想做成箱线图,看充电时间的分布情况,目前有的数据存在csv中,每个csv里存了一个月的数据。
思路大致如下:
1.每个csv转成DataFrame
2.提取出每个DataFrame表示充电时间的列,拼接成一个DataFrame
3.做盒图
遇到的问题是每个csv中充电的数据不一样多,这样选取的列包含的数据的数目就是不同的,解决办法是
可以先用Series函数将充电数据转换为Series数据,再存储到dataframe中,由于不同列的数目不相同,对应相同索引时,若不存在则为NaN

大致是这个样子的

在这里插入图片描述

from pandas import Series
import numpy as np 
...此处省略读取文件的操作
c_1309 =list
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值