今天在使用pandas时遇到个问题:df.sum()汇总计算数据和时,把空值当作0进行了计算
如果列数据不全为空,这样计算没啥问题,但如果列数据全为空,计算出的结果就不准确了
由于这几天才接触pandas,一直没找到pandas有没有自带判断列数据是否全空的方法
后来发现可以使用count()方法进行判断,在这儿记录下,给其他刚接触pandas有相同困扰的小伙伴们一点小帮助
a = [['a', 2, 3, None ],
['b', 2, 3, np.nan, None],
['c', 2, 3, 4, np.nan]]
columns=['name','age','class','score','math']
df = pd.DataFrame(a,columns=columns)
print(df)
print('________')
#df.count()会计算这个DataFrame各个列的有效值个数,可以用于判断某列数据是否全空
print(df.count())
print('________')
if df.count()['score'] == 0:
sumScore = np.nan
else:
sumScore = df['score'].sum()
print('sumScore:',sumScore)
# math这列数据全空,计算出的结果是nan
if df.count()['math'] == 0:
sumMath = np.nan
else:
sumMath = df['math'].sum()
print('sumMath:',sumMath)
#----------运行结果如下----------
# name age class score math
# 0 a 2 3 NaN NaN
# 1 b 2 3 NaN NaN
# 2 c 2 3 4.0 NaN
# ________
# name 3
# age 3
# class 3
# score 1
# math 0
# dtype: int64
# ________
# sumScore: 4.0
# sumMath: nan