关于参数thresh的理解(pd.dropna(thresh=n))

书上的表达:假设你只想保留包含一定数量的观察值的行,可以使用thresh参数来表示。

嗯嗯嗯....有些模棱两可。摸索了一番,终于理解了。

 

格式:df.dropna ( thresh=n )

 简单的理解:这一行除去NA值,剩余数值的数量大于等于n,便显示这一行。

 


 

1.先创建数组,代码如下:

 1 import numpy as np
 2 from numpy import nan as NA
 3 
 4 import pandas as pd
 5 from pandas import Series,DataFrame
 6 
 7 df = pd.DataFrame (np.random .randn(8,7))
 8 
 9 df.iloc[0,:] = NA
10 df.iloc[1,:6] = NA
11 df.iloc[2,:5] = NA
12 df.iloc[3,:4] = NA
13 df.iloc[4,:3] = NA
14 df.iloc[5,:2] = NA
15 df.iloc[6,0] = NA

 输出显示:(最左边一列是索引)

 


 

2.验证:

(1)n=1,即剔除NA值,这些行剩余的数值数量大于等于1

df.dropna(thresh=1)

输出显示:索引号为[0]的第1行被剔除

 

 

(2)n=3,即剔除NA值,这些行剩余的数值数量大于等于3

df.dropna(thresh=3)

输出显示:索引号为[0]至[2]的前3行被剔除

 

 

(3)n=6,即剔除NA值,这些行剩余的数值数量大于等于6

df.dropna(thresh=6)

输出显示:索引号为[0]至[5]的前6行被剔除

 

 

 

 

 

转载于:https://www.cnblogs.com/zeng-ymzkx/p/11468912.html

  • 18
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值