Pandas基础 - 数据处理

pandas 基础Pandas的数据处理DataFrame 的过滤DataFrame 的缺失值判断Series 与 DataFrame 的增删改查Pandas 的 查看与读写pandas 的数据查看Pandas的数据处理np.random.seed(0) #固定随机数 np.random.rand(6,4) #随机生成6行4列 的数df指整个表格,df[: 1] 指选择第一行,df[1:3] 选择多行,指索引1到索引3的2行。df[2::2] 指从df里面选择索引为2开头,步长为2
摘要由CSDN通过智能技术生成

Pandas的数据处理

  1. np.random.seed(0) #固定随机数 np.random.rand(6,4) #随机生成6行4列 的数
    在这里插入图片描述
  2. df指整个表格,df[: 1] 指选择第一行,df[1:3] 选择多行,指索引1到索引3的2行。
    在这里插入图片描述
  3. df[2::2] 指从df里面选择索引为2开头,步长为2的 所有行。
    在这里插入图片描述
  4. 选择的序列,df[“A”] 指选择A列
    在这里插入图片描述
  5. df[[ ]];表示2维,截取的表格,df[ ] 表示1维,截取的的列。df[[“A”,“B”]] = df.iloc [ :,[“A”,“B”]] 表示截取的多行多列。

在这里插入图片描述
6. df的显示与隐式的切法:loc 表示显示,iloc 表示隐式。df.loc[“a”:“b”,[“A”,“B”]] 表示a到b的行,A,B两列开始切,即切的4个数据。df.iloc[1:3,2:4] 表示从第1个索引到3个索引,切的2行,再从第3列到第5列(左闭右开),切的2列,即C列与D列。
在这里插入图片描述

DataFrame 的过滤

  1. 两种df的过滤对比:df > 0 表示表里每一个元素是否大于0,返回的是布尔值。df[df>0]表示留着大于0的数,Nan表示空值。
    在这里插入图片描述

  2. 对大于0 的数求和,计数,求平均,进行聚合运算。
    在这里插入图片描述

  3. df.loc[“a”] 指找出a 列大于0 的数,返回布尔值。df.loc[:,df.loc[“a”]>0] 指保留"a"列里大于0的所有行,即只要a列有大于0 的数,全都显示。
    ![![在这里插入图片描述](https://img-blog.csdnimg.cn/20201111155515739.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1lpbl9DaHVu,size_16,color_FFFFFF,t_70#pic_center)

  4. df[df[“A”]>0] 表示过滤出 A 列大于0的所有行。
    在这里插入图片描述

  5. 举例:df.loc[(df[‘A’]>0)&(df[‘B’]<0),(df.loc[‘a’])>0&(df.loc[‘b’]<0)]
    第一步:用的显示索引,df.loc[ ,] 切的是表格。
    第二步:df[“A”]&df[“B”] 表示同时满足A列大于0 和 B 列小于0的行。
    第三步:df.loc[‘a’])>0&df.loc[‘b’]<0,表示同时满足a 行大于0 和 b 行小于0的列。

在这里插入图片描述

DataFrame 的缺失值判断

  1. 第一步,需要用到的2个库:numpy and pandas(Series 和 DataFrame)

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值