python数据框转化为矩阵_python – Pandas通过条件将df转换为矩阵

本文介绍了如何利用numpy的广播特性,通过Python的Pandas库将DataFrame根据特定条件转换为矩阵。首先,创建一个从1到DataFrame中Value最大值的序列,然后与DataFrame的Value列进行比较,生成布尔矩阵。最后,将布尔矩阵转换为数据框并按Name列进行分组求和,得到最终的矩阵结果。这种方法虽然速度快,但可能消耗大量内存,适用于中等大小的数据集。
摘要由CSDN通过智能技术生成

可能是最快的解决方案,使用numpy的广播 –

i = np.arange(1, df.Value.max() + 1)

j = df.Value.values[:, None] >= i

df = pd.DataFrame(j, columns=i, index=df.Name).sum(level=0)

1 2 3 4 5

Name

x 4.0 4.0 3.0 1.0 1.0

y 2.0 2.0 1.0 0.0 0.0

z 1.0 1.0 1.0 1.0 0.0

警告:为了换取性能,这有点像一种记忆饥渴的方法.对于大数据,可能会导致内存爆裂,因此请慎重使用.

细节

创建一系列值,从1到df.Value.max() –

i = np.arange(1, df.Value.max() + 1)

i

array([1, 2, 3, 4, 5])

与df.Values和i进行广播比较 –

j = df.Value.values[:, None] >= i

j

array([[ True, True, True, True, True],

[ True, True, False, False, False],

[ True, True, True, False, False],

[ True, True, True, False, False],

[ True, True, True, False, False],

[ True, True, False, False, False],

[ True, True, True, True, False]], dt

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值