DataFrame插入多列PerformanceWarning: DataFrame is highly fragmented.

DataFrame插入多列PerformanceWarning: DataFrame is highly fragmented.

dataframe列比较多,增加列的代码如下:

df=pd.DataFrame()
for i in range(1000):
    vlist=[]
    
    for j in range(1000):
       vlist.append(j)     
    df['COL_' + str(i)] =  vlist
                 
df

警告错误:

/tmp/ipykernel_27622/2631638338.py:7: PerformanceWarning: DataFrame is highly fragmented. This is usually the result of calling frame.insert many times, which has poor performance. Consider joining all columns at once using pd.concat(axis=1) instead. To get a de-fragmented frame, use newframe = frame.copy()

df[‘COL_’ + str(i)] = vlist 就是insert ,提示碎片多,执行的时间长。
按提示,用pd.concat(axis=1) 增加列数据。
做一个中间的dataframe变量,通过pd.concat()将两个dataframe变量合并,赋值到df变量中,解决insert效率低,碎片多的警告错误。

df=pd.concat([df,frames], axis=1)

修改后代码如下:

df=pd.DataFrame()
for i in range(1000):
    vlist=[]
    
    for j in range(1000):
       vlist.append(j)     
    frames = pd.DataFrame(pd.Series(vlist),columns=['COL_' + str(i)])
    df=pd.concat([df,frames], axis=1)
                 
df

运行速度快了不少,不再提示警告错误。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值