AI实践 Task02-Pandas入门

AI实践 Task02-Pandas入门

导入

import pandas as pd

数据结构

  • Series是一种一维数据结构,每一个元素都带有一个索引,其中索引可以为数字或字符串。其基本数据结构包括索引列和单列的数据列。
  • Dataframe是一种二维数据结构,数据以表格形式(与excel类似)存储,有对应的行和列。其基本数据结构为索引列和多列数据。

读取csv/tsv

  • csv:pd.read_csv()

  • tsv:pd.read_table()

  • sep参数指定分隔符

  • names参数指定列名(右对齐)

  • index_col参数指定索引列

  • chunkersize参数指定分块大小

相关函数

数据分析

  • loc/iloc/索引 读取指定行/列数据
  • isnull/isna 分析空数据
  • head/tail 读取头/尾数据
  • info 查看数据基本信息
  • describe 获取数据统计信息
  • rank 获取排名
  • value_counts 获取计数
  • max/min/median/count/mean 最大值/最小值/中位数/计数/均值

数据处理

inplace参数指定是否替换原始数据

  • rename(columns=map)以映射表重命名列名

    map={
    'key':'translate'
    ...
    }
    df.rename(columns=map,inplace=True)
    
  • reset_index()重置索引序列

  • 索引中使用布尔表达式 进行条件筛选

数据保存

to_csv('filename',index=False)保存csv至指定目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值