Pandas数据汇总

import numpy as np
import pandas as pd
data = [[1,None],[4,5][None,None],[8,9],[3,4]]
Traceback (most recent call last):
File “<pyshell#2>”, line 1, in
data = [[1,None],[4,5][None,None],[8,9],[3,4]]
TypeError: list indices must be integers or slices, not tuple

data = [[1,None],[4,5],[None,None],[8,9],[3,4]]
df = pd.DataFrame(data,columns=[‘a’,‘b’])
df
a b
0 1.0 NaN
1 4.0 5.0
2 NaN NaN
3 8.0 9.0
4 3.0 4.0

df.head() #默认显示前5行
a b
0 1.0 NaN
1 4.0 5.0
2 NaN NaN
3 8.0 9.0
4 3.0 4.0

df.tail() #后5行
a b
0 1.0 NaN
1 4.0 5.0
2 NaN NaN
3 8.0 9.0
4 3.0 4.0

df.info() #数据基础信息
<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 5 entries, 0 to 4
Data columns (total 2 columns):
a 4 non-null float64
b 3 non-null float64
dtypes: float64(2)
memory usage: 120.0 bytes

df.describe() #数据汇总
a b
count 4.00000 3.000000
mean 4.00000 6.000000
std 2.94392 2.645751
min 1.00000 4.000000
25% 2.50000 4.500000
50% 3.50000 5.000000
75% 5.00000 7.000000
max 8.00000 9.000000

df.count()
a 4
b 3
dtype: int64

df.mean()
a 4.0
b 6.0
dtype: float64

df.sum()
a 16.0
b 18.0
dtype: float64

df.sum(axis=1)
0 1.0
1 9.0
2 0.0
3 17.0
4 7.0
dtype: float64

df
a b
0 1.0 NaN
1 4.0 5.0
2 NaN NaN
3 8.0 9.0
4 3.0 4.0

df.cumsum() #累加求和
a b
0 1.0 NaN
1 5.0 5.0
2 NaN NaN
3 13.0 14.0
4 16.0 18.0

df.std() #标准差
a 2.943920
b 2.645751
dtype: float64

df.var() #方差
a 8.666667
b 7.000000
dtype: float64

df.max()
a 8.0
b 9.0
dtype: float64

df.min()
a 1.0
b 4.0
dtype: float64

df.quantile(0.5) #中位数,可改数值
a 3.5
b 5.0
Name: 0.5, dtype: float64

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值