python fillna_python – 基于特定列属性的Pandas fillna()

这篇博客讨论了如何在Pandas数据框中处理缺失值,特别是针对'Type'=Dog的'Killed'列。作者展示了如何计算平均值并用它来填充NaN值,使用了不同的DataFrame操作,如条件筛选、fillna方法和ix索引。代码示例展示了如何有效地实现这一过程。
摘要由CSDN通过智能技术生成

假设我有这张桌子

Type | Killed | Survived

Dog 5 2

Dog 3 4

Cat 1 7

Dog nan 3

cow nan 2

[Type] = Dog缺少Killed值之一.

我想在[类型] =狗的[Killed]中归咎于平均值.

我的代码如下:

>搜索平均值

df [df [‘Type’] ==’Dog’].mean().round()

这将给我平均值(约2.25)

>估算均值(这是问题开始的地方)

df.loc [(df [‘Type’] ==’Dog’)& (df [‘Killed’])].fillna(2.25,inplace = True)

代码运行,但值不是估算,NaN值仍然存在.

我的问题是,我如何根据[Type] = Dog来估算[Killed]中的均值.

最佳答案 对我来说工作:

df.ix[df['Type'] == 'Dog', 'Killed'] = df.ix[df['Type'] == 'Dog', 'Killed'].fillna(2.25)

print (df)

Type Killed Survived

0 Dog 5.00 2

1 Dog 3.00 4

2 Cat 1.00 7

3 Dog 2.25 3

4 cow NaN 2

如果系列需要fillna – 因为2列被杀和幸存:

m = df[df['Type'] == 'Dog'].mean().round()

print (m)

Killed 4.0

Survived 3.0

dtype: float64

df.ix[df['Type'] == 'Dog'] = df.ix[df['Type'] == 'Dog'].fillna(m)

print (df)

Type Killed Survived

0 Dog 5.0 2

1 Dog 3.0 4

2 Cat 1.0 7

3 Dog 4.0 3

4 cow NaN 2

如果需要fillna只在Killed列中:

#if dont need rounding, omit it

m = round(df.ix[df['Type'] == 'Dog', 'Killed'].mean())

print (m)

4

df.ix[df['Type'] == 'Dog', 'Killed'] = df.ix[df['Type'] == 'Dog', 'Killed'].fillna(m)

print (df)

Type Killed Survived

0 Dog 5.0 2

1 Dog 3.0 8

2 Cat 1.0 7

3 Dog 4.0 3

4 cow NaN 2

您可以重用以下代码:

filtered = df.ix[df['Type'] == 'Dog', 'Killed']

print (filtered)

0 5.0

1 3.0

3 NaN

Name: Killed, dtype: float64

df.ix[df['Type'] == 'Dog', 'Killed'] = filtered.fillna(filtered.mean())

print (df)

Type Killed Survived

0 Dog 5.0 2

1 Dog 3.0 8

2 Cat 1.0 7

3 Dog 4.0 3

4 cow NaN 2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值