关于Jupyter中数据分析工具Pandas详细介绍

Panda数据结构分析

一般来说,我们Panda中有两个数据结构,一个是Series,另一个是DataFrame

一、Series


Series类似于一个一维的数组对象能够保存任何数据类型,其中Series索引再左边数据在右边

Pandas.Series(data=None,index=none,dype=none,copy=none)
#data作为传输的数据可以是列表,数组
#index是索引是唯一的,且与数据的长度是一致的,默认是0-n
#dtype是数据类型,copy是,是否复制数据

创建Series
在这里插入图片描述
在这里插入图片描述

二、DataFrame


DataFram类似于一个二维数组或者表格,每列可以是不同的数据类型与Series结构类似,结构如下所示

pd.DataFram(data=none,index=none,columns=none,dytpe=none,copy=none)
#index为行标签,如果没有传入默认是0-n
#columns为列标签,如果没有传入默认也是0-n
#其余属性和Series一样

Series为了更加方便的操作Series对象为此提供了两个属性,index和value,通过这两个数据可以获取到Series的索引和数据
在这里插入图片描述

创建DataFram


DataFrame为了便利的获取到数据,有两种方法可以
一:可以通过索引的方法进行或者
二:可以通过属性的方式来获取(有个弊端,当属性里面有空格或者特殊符号的时候会报错)
在这里插入图片描述
在这里插入图片描述

Pandas索引操作及高级索引

重置索引
reindex()方法的作用是对原索引和新索引进行匹配,也就是说,新索引含有原索引的数据,而原索引数据按照新索引排序,如果新索引没有原数据程序不会报错,会自动填充nan或者通过fill_values()进行填充

DataFrame.reindex(labels=none,index=none,columns=none,
axis=none,method=none,fill_value=nan,limit=none)
#index用作索引的新序列
#method插值的填充方式
#fill_引入缺失值使用的替代值
#limit向前或者向后填充时最大填充量

在这里插入图片描述

在这里插入图片描述
索引操作

Series的索引操作


在这里插入图片描述

DataFrame

在这里插入图片描述

在这里插入图片描述

算术运算与数据对齐

在这里插入图片描述

数据排序

按索引进行排序

sort_index(axis=0,level=none,ascending=True,inplace-False,kind='quicksort')
#axis 0代表是行,1代表是列
#level 若不为none则对指定索引级别的值进行排序
#asceding 默认升序
#kind 选择排序算法

在这里插入图片描述

按值进行排序

sort_values(by,axis=0,ascending=True,kind=,na_position=,inplace)
#by 代表排序的列
#na_position,代表将缺失值放到开头还是结尾,参数是:first和last
#

在这里插入图片描述

统计计算与描述

在这里插入图片描述

describe()一次性统计输出多个统计指标

在这里插入图片描述

层次化索引

在这里插入图片描述

swaaplevel()交换内外层索引

在这里插入图片描述

读写数据操作

通过pd.read_***()读取文件
通过pd.to_**()写入文件
**代表文件后缀名,txt文件可以用read_csv()或者read_table()

在这里插入图片描述
在这里插入图片描述

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值