Pandas:数值计算基本方法

最新推荐文章于 2024-04-21 15:34:23 发布

圻子-

最新推荐文章于 2024-04-21 15:34:23 发布

阅读量1.4k

点赞数 1

文章标签： python 数据分析

本文链接：https://blog.csdn.net/weixin_44507435/article/details/104907379

版权

文章目录

1.基本参数：axis、skipna


import numpy as np
import pandas as pd

df = pd.DataFrame({
   'key1':[4,5,3,np.nan,2],
                 'key2':[1,2,np.nan,4,5],
                 'key3':[1,2,3,'j','k']},
                 index = ['a','b','c','d','e'])
print(df)
print(df['key1'].dtype,df['key2'].dtype,df['key3'].dtype)
print('-----')

m1 = df.mean()
print(m1,type(m1))
print('单独统计一列:',df['key2'].mean())
print('-----')
# np.nan ：空值
# .mean()计算均值
# 只统计数字列
# 可以通过索引单独统计一列

m2 = df.mean(axis=1)
print(m2)
print('-----')
# axis参数：默认为0，以列来计算，axis=1，以行来计算，这里就按照行来汇总了

m3 = df.mean(skipna=False)
print(m3)
print('-----')
# skipna参数：是否忽略NaN，默认True，如False，有NaN的列统计结果仍未NaN

   key1  key2 key3
a   4.0   1.0    1
b   5.0   2.0    2
c   3.0   NaN    3
d   NaN   4.0    j
e   2.0   5.0    k
float64 float64 object
-----
key1    3.5
key2    3.0
dtype: float64 <class 'pandas.core.series.Series'>
单独统计一列: 3.0
-----
a    2.5
b    3.5
c    3.0
d    4.0
e    3.5
dtype: float64
-----
key1   NaN
key2   NaN
dtype: float64
-----

2.Series和DataFrame的主要计算方法

# 主要数学计算方法，可用于Series和DataFrame（1）

df = pd.DataFrame({
   'key1':np.arange(10),
                  'key2':np.random.rand(10)*10})
print(df)
print('-----')

print(df.count(),'→ count统计非Na值的数量\n')
print(df.min(),'→ min统计最小值\n',df['key2'].max(),'→ max统计最大值\n')
print(df.quantile(q=0.75),'→ quantile统计分位数，参数q确定位置\n')
print(df

最低0.47元/天解锁文章

圻子-

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Pandas:数值计算基本方法

文章目录1.基本参数：axis、skipna2.Series和DataFrame的主要计算方法3.unique()唯一值与sort()排序方法4.值计数：.value_counts()5.成员资格：.isin()课后作业作业一：如图创建一个Dataframe（5*2，值为0-100的随机值），并分别计算key1和key2的均值、中位数、累积和作业二：写出一个输入元素直接生成数组的代码块，然后创建一...
复制链接

扫一扫