python必备库 学习笔记 pandas(一)

本文深入探讨了pandas库,重点介绍了DataFrame数据结构,包括其创建、属性和方法,如DataFrame.head()和DataFrame.tail()。还讨论了DataFrame的索引设置、操作和排序,以及Series、MultiIndex的相关概念。此外,提到了pandas的文件读取和存储,如csv、hdf5和json,并展示了如何利用pandas进行数据可视化。
摘要由CSDN通过智能技术生成

pandas

  • 专门用于数据挖掘的开源python库
  • 以numpy为基础,借助numpy模块在计算方面性能高的优势
  • 基于matplotlib,能够简便的画图
  • 提供独特的数据结构—DataFrame、Panel、Series

pandas的优势

  • 便捷的数据处理能力
  • 读取文件方便
  • 封装了Matplotlib,numpy库,便于画图和计算

DataFrame

pandas核心数据结构—DataFrame

  • DataFrame是具有行索引和列索引的二维数组
创建DataFrame

直接通过二维数组创建DataFrame,会生成默认索引的DataFrame
在这里插入图片描述

DataFrame的结构

DataFrame对象不仅由行索引,又有列索引,是一个具有行列索引的二维数组

  • 行索引,表示不同行的横向索引,叫做index
  • 列索引,表示不同列的纵向索引,叫做columns
    在这里插入图片描述
DataFrame的属性
DataFrame.shape

返回DataFrame的行列数(a,b),a表示行数,b表示列数
在这里插入图片描述

DataFrame.index

返回DataFrame的行索引
在这里插入图片描述

DataFrame.columns

返回DataFrame的列索引
在这里插入图片描述

DataFrame.values

返回DataFrame里的数据
在这里插入图片描述

DataFrame.T

返回DataFrame的转置
在这里插入图片描述

DataFrame的方法
DataFrame.head()

默认返回DataFrame的前五行,不足五行的直接返回
在这里插入图片描述
传入需要取的行数,如我想取7行,DataFrame.head(7)即可
在这里插入图片描述

DataFrame.tail()

默认返回DataFrame的最后五行,不足五行的直接返回
在这里插入图片描述
可以传入需要取的行数,如需要取倒数7行,则DataFrame.tail(7)
在这里插入图片描述

DataFrame索引设置

DataFrame索引只能整体修改,即只支持行索引或列索引整体修改,不支持行索引或列索引某个元素单独修改

修改DataFrame的行索引
  1. 创建DataFrame时,传入列表赋值给index
    在这里插入图片描述
  2. 用一个新列表对DataFrame.index重新赋值即可完成修改,
    在这里插入图片描述
修改DataFrame的列索引
  1. 创建DataFrame时,传入一个列表对DataFrame.columns进行赋值
    在这里插入图片描述
  2. 用一个新列表对DataFrame.columns重新赋值即可完成修改
    在这里插入图片描述
重设索引

DataFrame.reset_index(drop=False)

  • 设置新的索引
  • 默认drop值为false,即不删除原来索引,True则删除原来的索引
  • 常用于某行或某几行数据被删掉

直接使用会将原索引存进DataFrame中
在这里插入图片描述
传入参数drop=True&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值