dataframe 一列的不同值_数据分析Pandas运用 | DataFrame基础知识.(71)

数据分析之pandas库运用前6节简单的介绍pandas的安装与导入,数据结构,控制流与循环,函数,类型的知识点,现在开始进入pandas的讲解。

Pandas是一个用于数据分析的开源Python库。强大的结构化数据分析功能(依赖于Numpy),提供多种高级数据结构:Series、Data Frame、Panel,强大的数据索引和处理能力,它让Python能处理电子表格等数据。提供了数据快速加载、操作、对齐与合并等功能。Data Frame表示整个电子表格或矩形数据,而Series是Data Frame的单列。Data Frame可以看作是由Series对象组成的字典或集合。

数据集加载

当给定一个数据集,首先要加载它并查看其结构内容。查看数据集最简单方法是检查特定的行和列,并对它们取子集。查看每列中存储信息的类型,并通过聚合描述性统计来发现模式,与使用Excel的方式其实一样。

Pandas并不是Python标准库的一部分,所以在使用之前需要先导入,如示:

3c4a0ff45be74a3f6d7d1ebe8ca3c46b.png

导入Pandas库后,就可以调用read_csv函数来加载CSV数据文件,调用Pandas的read_csv函数时要用点表示法。详细参阅《数据分析之pandas库运用(1)》、《数据分析之pandas库运用.(5)》、《数据分析之pandas库运用.(6)》。

41d81697e8518d1f5ac16a2b4509256e.png

检查read_csv读取返回的是否为Data Frame,使用Python内置的type函数(该函数是python的内置函数,不属于Pandas或任何包)

1a0fd083c9cdbf65ab0dbee311e6721d.png

d8d828748fd610c4c496666ef2b6a96b.png

处理多个Python对象,并且想知道当前处理的是哪个对象时,type函数会非常有用,至于是否加print(),建议保持正确的编程习惯,是非常有必要的。

加载的数据集被保存为Pandas DataFrame对象,每一个Data Frame对象都有一个shape属性,用来指明Data Frame的行数和列数,如同使用Excel一样的行数和列数。

57a586418205c2cae21a18894be56c6b.png

Shape属性返回一个元组(参阅《数据分析之pandas库运用(3)》,其中第一个值是行数,第二值是列数。结果显示data数据集有1704行,6列。

前面查看数据集保存的对象,数据集有多少行,多少列,为了获取数据集中的信息要点,需查看数据集的列,可用Data Frame的columns属性来得到列名。

02737784455fc541748a842ad473318a.png

Pandas的Data Frame对象,每列的类型必须相同,而每行而已包含混合类型。使用Data Frame的dtypes属性或info方法来查看

898d62b8f72eed24a9edb7c133127de6.png

84c62e40dbe52e6e38f9d95830f2f169.png

print(df.dtypes)输出的是country、continent列为object类型,year、pop例为int64类型,lifeExp、gdpPercap列为float64。

print(df.info())输出的是read_csv读取返回为DataFrame,index:1704行,从0到1703,数据列共有6列,并分别告诉每一列的有1704非空值,以及对应的类型,以及统计不同类型有几个,内存使用量是80.0+KB

dac1b6a6df493b9709a4fdd51868bb8d.png

资料 (1).源代码 链接: https://pan.baidu.com/s/1sYqgLxVPwjgGsawKRsWb5A 提取码:0007

相关阅读:

数据分析之pandas库运用.(1)

数据分析之pandas库运用.(3)

数据分析之pandas库运用.(5)

数据分析之pandas库运用.(6)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值