pandas常用的数据分析函数(一)

(1)查看数据函数

当收集到某一csv文件数据时,常用的查看函数

	inspect_dataset(df_data)
 def inspect_dataset(df_data):
     """
            查看加载的数据基本信息
     """
    print '数据集基本信息:'
    print df_data.info()
    
    print '数据集有%i行,%i列' %(df_data.shape[0], df_data.shape[1])
    print '数据预览:'
    print df_data.head()

 此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化

(2)处理缺失数据函数

  当数据文件中有缺失数据时,用此函数处理Na数据:

def process_missing_data(df_data):
    """
            处理缺失数据
    """
    if df_data.isnull().values.any():
        # 存在缺失数据
        print '存在缺失数据!'
        df_data = df_data.fillna(0.)    # 填充nan
        # df_data = df_data.dropna()    # 过滤nan
    return df_data                     	#返回数据
    #return df_data.reset_index()     #此为返回重置索引
  此函数传进的参数df_data扔然为一DataFrame文件,其他文件需要相应的格式转化,

 当需要直接过滤时时用df_data.dropna(),

 当需要填充为数值或字符串时用df_data.fillna(0.)

 当需要返回数据时用return df_data

 当需要返回其处理后数据的重置索引时,用reset_index()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas 是一个强大的数据分析工具,它提供了许多常用函数来处理和分析数据。下面是一些常用Pandas 数据分析函数: 1. 读取数据: - `pd.read_csv()`:读取以逗号分隔的文本文件 - `pd.read_excel()`:读取 Excel 文件 - `pd.read_sql()`:从 SQL 数据库中读取数据 2. 数据预览和基本信息: - `df.head()`:返回数据集的前几行,默认返回前 5 行 - `df.tail()`:返回数据集的后几行,默认返回后 5 行 - `df.info()`:查看数据集的基本信息,包括列名、数据类型、非空值数量等 - `df.describe()`:显示数据集的基本统计信息,如平均值、标准差、最小值、最大值等 3. 数据选择和过滤: - `df.loc[]`:按行标签和列标签选择数据 - `df.iloc[]`:按行号和列号选择数据 - `df[df['column'] > value]`:根据条件选择数据 4. 数据清洗和处理: - `df.dropna()`:删除包含缺失值的行或列 - `df.fillna(value)`:用指定的值填充缺失值 - `df.drop_duplicates()`:删除重复的行 - `df.replace(old_value, new_value)`:替换指定值 5. 数据排序和排名: - `df.sort_values(by='column', ascending=True)`:按指定列的值进行升序排序 - `df.rank()`:对数据进行排名 6. 数据聚合和分组: - `df.groupby('column').mean()`:按指定列进行分组,并计算每个组的平均值 - `df.groupby('column').sum()`:按指定列进行分组,并计算每个组的总和 - `df.pivot_table(values='value', index='index_column', columns='column')`:创建数据透视表 这只是一些常用Pandas 数据分析函数,还有很多其他函数可以根据具体需求使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值