Python:Pandas:DataFrame基础(1)

引子

    在用python解决实际问题时,从磁盘文件读取数据是经常要做的工作。这篇文章
主要说一下python读取excel文件中的数据。利用python读取excel中的数据是一件
来读取的方式,在我看来这种方式已经足够简单了,以至于我不想再了解其他的方式。
要想使用这种方式,首先需要在代码中引入两个包:
`import numpy as np`
`import pandas as pd`
然后仅需要一行代码即可完成python读取excel的操作,这里给一个实际的代码:
`data = pd.read_excel('D:/homework.xlsx', index_col=0)`
"index_col=0"可以这样理解:把homework.xlsx中的第一列设置为主键。

步入正题

    以上这些,都太简单,不足以作为本文的正题。问题是,当把homework.xlsx
类型呢?这里不能想当然地认为data的访问方式类似于二维数组,这是大错特错的,
当然也不要以为data的访问方式很繁琐,如果真的很繁琐的话,我也不会在众多的读
的,记住了好几次,忘记了好几次。
    下面主要通过实例的方式讲解:
    首先,我得把excel中的数据读到data变量中
   import numpy as np
   import pandas as pd
   data = pd.read_excel('D:/homework.xlsx', index_col=0)
   print(data)
    将data输出到控制台上,结果如下:

这里写图片描述

    其中,“纳税人编号”是主键,并且,data中索引为0的列是“销售类型”这一列,被设置为主键的列不能算。

1、使用head()方法可以查看data的前几行数据(默认是前5行):

    print(data.head())
    输出结果如下:

这里写图片描述

    除了默认前5行,也可以指定是前几行,例如:
    print(data.head(3))
    输出结果如下:

这里写图片描述

    同理,使用tail()方法可以查看后几行数据(默认是后5行)。

2、查看data的索引

    print(data.index)
    输出结果如下:

这里写图片描述

3、查看data的列名

    print(data.columns)
    输出结果如下:

这里写图片描述

    同理,查看data的数据值用data.values,查看描述性统计用data.describe(),转置数据用data.T。
    对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序,如data.sort(columns = u'维修毛利'),输出结果如下:

这里写图片描述

结束:好了,这篇文章到此结束,后面的文章有进一步的介绍。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值