pandas基本操作

pandas基本操作

  • numpy已经可以帮助我们进行数据的处理了,那么学习pandas的目的是什么呢?
    - numpy能够帮助我们处理的是数值型的数 据,当然在数据分析中除了数值型的数据还有好多其他类型的数据(字符串,时间序列),那么pandas就可以帮我们很好的处理除了数值型的其他数据!

pandas常用的两个类

  • Series
  • DataFrame

在这里插入图片描述

Series

  • Series是一种类似与一维数组的对象,由下面两个部分组成:

    • values:一组数据(ndarray类型)

    • index:相关的数据索引标签

  • Series的创建

    • 由列表或numpy数组创建
    • 由字典创建

显示索引
显示索引

Series里面的数据源必须是一个一维的数据结构,不可以是二维的
Series里面的数据源必须是一个一维的数据结构,不可以是二维的
index是用来指定显示索引,默认的0,1,2是隐式索引,所以在一个Series中既有显示索引又有隐式索引
index是用来指定显示索引,默认的0,1,2是隐式索引,所以在一个Series中既有显示索引又有隐式索引
参数中data是指定数据源;index是指定索引;dtype是用来指定元素类型的
显示索引会不会覆盖隐式索引:不会

Series的索引和切片
在这里插入图片描述
索引
在这里插入图片描述

在这里插入图片描述
切片
在这里插入图片描述

  • Series的常用属性
    在这里插入图片描述
    在这里插入图片描述

  • Series的常用方法
    - head() 显示前n个元素
    tail() 后n个元素
    - unique() 去重
    nunique() 返回去重之后元素的个数
    - isnull() 用来检测元素是否为空
    notnull() 用来检测元素是否为非空
    - add() sub() mul() div()
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • Series的算术运算

    • 法则:显式索引一致的元素进行算数运算 否则补空

DataFrame

  • DataFrame是一个【表格型】的数据结构。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维(这个多维特指是二维,DataFrame只能是二维不能是更高维度了)。DataFrame既有行索引,也有列索引。
    • 行索引:index
    • 列索引:columns
    • 值:values
  • DataFrame的创建:DataFrame(data = ,index = ,columns = ,dtype = )
    • data 指定数据源:
      • 列表list创建
      • ndarray创建
      • 字典创建
  • index 指定显式行索引
  • columns 指定显式列索引
  • dtype 指定表格中元素的类型

使用嵌套列表充当数据源的时候每个小列表都是DataFrame一行的内容
在这里插入图片描述
使用字典充当数据源的时候字典的键就是DataFrame的列名(列索引),字典键对应的值就是一列的值
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • df索引和切片操作
    • 索引:
      • df[col]:取列
      • df.loc[index]:取行
      • df.iloc[index,col]:取元素
  • 切片:
    • df[index1:index3]:切行
    • df.iloc[:,col1:col3]:切列
  • DataFrame的运算
    • 同Series
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值