pandas dataframe创建_Pandas入门系列(一)

209a450d4adb932b1f2dab2952d5f711.png

NumPy入门系列(一)

NumPy入门系列(二)

何为Pandas?

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。


pandas的数据结构

Series

Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。

pd.Series(    data=None,          一组数据类型(python内置序列,numpy一维数组)    index=None,        数据索引,默认为0-  N-1    dtype=None,        数据类型    name=None,    copy=False,    fastpath=False,)
32352ae44c69e5b7e901cec7d5ebf2f7.png
6e76764dfaf06c9254e7238024d6553c.png
53bda80a60f9d4087a213dc1ccb3a4a1.png
ae88c0f74f9cd9aa27848717c5bcd4d9.png

Series对象本身及其索引都有一个name属性,该属性跟pandas其他的关键功能关系非常密切:

bed08ce33e674801d227e846475c673c.png

DataFrame

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的类型(数值、字符串、布尔值等。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引。创建DataFrame的办法有很多,最常用的一种是直接传入一个由等长列表或NumPy数组组成的字典:

7985d370a0a5175eddde0af38fec6332.png

你可以设置dataframe的显示范围:

11bb75e8fb6f272d59e7265c582bdd4b.png

dataframe的属性:

564aef061fe7f4b75f21bcf42bbdf198.png

从二维数组创建或从表格重塑表格:

41453a259a969ce4fb0eadff661ce204.png

数据表的索引与修改:

fd84180d8b25a059bac32b53bbf1ba6f.png

将列表或数组赋值给某个列时,其长度必须跟DataFrame的长度相匹配。如果赋值 的是一个Series,就会精确匹配DataFrame的索引,所有的空位都将被填上缺失 值:

53e962fb827e91bbe1a53bd1cbea0a4d.png

可以用del方法删除列:

6a4008f9a8ae2ce0c3ce5a46ec8676a1.png

数据类型访问:

8af3a03a7763a14a10094e671c0d856d.png

下表列出了DataFrame构造函数所能接受的各种数据:

be3123b313e2809756dfa17204e6e874.png

索引对象 index

构建Series或 DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index,Index对象是不可变的,因此用户不能对其进行修改:

70f6e25b2eedc39b89e01c37095f05df.png

另外,pandas的Index可以包含重复的标签。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值