#Python 19- Pandas模块-DataFrame入门

pandas确实比较重要,所以我还是花多点时间和精力来细细学习具体的用法,所以未来几天的推文都是会围绕着pandas模块来进行专题学习与推送嘻嘻!

0?wx_fmt=jpeg

pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这么说你可能无法从感性上认识它,举个例子,你大概用过Excel,而它也是一种数据组织和呈现的方式,简单说就是表格,而在在pandas中用DataFrame组织数据,如果你不print DataFrame,你看不到这些数据,下面我们来看看DataFrame是如何使用的。

首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块

0?wx_fmt=png

先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值

0?wx_fmt=png

为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列

0?wx_fmt=png

我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数

0?wx_fmt=png

这又是一个字典创建DataFrame的例子

0?wx_fmt=png

假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:

0?wx_fmt=png

可以使用dtypes来查看各行的数据格式

0?wx_fmt=png

接着看一下如何查看数据框中的数据,看一下所有的数据

0?wx_fmt=png

使用head查看前几行数据(默认是前5行),不过你可以指定前几行

0?wx_fmt=png

查看前三行数据

0?wx_fmt=png

使用tail查看后5行数据

0?wx_fmt=png

查看数据框的索引

0?wx_fmt=png

查看列名用columns

0?wx_fmt=png

查看数据值,用values

0?wx_fmt=png

查看描述性统计,用describe

0?wx_fmt=png

使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据

0?wx_fmt=png

使用T来转置数据,也就是行列转换

0?wx_fmt=png

对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。

0?wx_fmt=png

0?wx_fmt=jpeg

以上就是今日关于pandas模块的dataframe进行讲解,有点啰嗦嘿嘿!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值