pandas(2)

最新推荐文章于 2023-11-05 02:55:07 发布

VIP文章 samll-guo

最新推荐文章于 2023-11-05 02:55:07 发布

阅读量655

点赞数

分类专栏： alot学习 python数据分析文章标签： c++ pandas

本文链接：https://blog.csdn.net/m0_58465990/article/details/120429280

版权

描述性统计信息函数

2.汇总数据

describe()函数是用来计算有关的dataframe列的统计信息摘要

import numpy as np
import pandas as pd

data={
    'name':pd.Series(list('abcde')),
    'age':pd.Series([112,22,32,43,54]),
    'rating':pd.Series([3.22,4.22,5.22,6.22,7.22])
}

df=pd.DataFrame(data)

df

输出：

df.describe()#信息汇总

df.describe(include=['object'])#信息字符串列信息

df.describe(include='all')#所有信息汇总

3.统计函数

4.窗口函数

为了处理数字数据，pandas提供了几个变体，如滚动，展开和指数移动窗口统计的权重。其中包括总和，均值，中位数，方差协方差，相关性等

作用：窗口函数主要用于通过平滑曲线来与图形方式查找数据内的趋势。如果日常数据中有很多变化，并且有很多数据点可用，那么采样和绘图就是一种方法，应用窗口计算并在结果上绘制图形是另一种方法。通过这些方法，可以平滑曲线或趋势

丢失数据

首先要：检查缺失值

df.isnull()#表中检查是否有缺失

df.notnull()#是否没有缺失

df['name'].isnull()#name列是否有缺失

输出：

0    False
1    False
2    False
3    False
4    False
Name: name, dtype: bool

df.isnull().sum()#快速确认分别有多少个缺失值

输出：

name      0
age       0
rating    0
dtype: int64

df.isnull().sum().sum()#总共有多少个缺失值

输出：

0

缺少数据的计算

在求和数据时，NaN将被视为0(求平均值时，除以的个数中也不含NaN的个数）

丢失NaN

方法：dropna()函数

默认情况下，axis=0,即在行上面应用，这意味着如果行内的任何值是NaN，那么整个行被排除

fillna()函数

作用：使用标量去替换

replace()函数

很多时候，必须用一些具体的值取代一个通用的值。可以通过应用替换方法来实现这一点

interpolate()函数

最低0.47元/天解锁文章

samll-guo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas(2)

描述性统计信息函数2.汇总数据describe()函数是用来计算有关的dataframe列的统计信息摘要import numpy as npimport pandas as pddata={ 'name':pd.Series(list('abcde')), 'age':pd.Series([112,22,32,43,54]), 'rating':pd.Series([3.22,4.22,5.22,6.22,7.22])}df=pd.DataFrame(.
复制链接

扫一扫