Pandas统计分析基础之DataFrame

掌握DataFrame的常用操作

DataFrame类似于数据库的表或者Excel的表格,panda将数据读取之后,以DataFrame的数据结构存储在内存中。
下面就来介绍一下DataFrame的增删查改操作。

1、基础属性

在这里插入图片描述

2、查看DataFrame中的数据

查询DataFrame的数据

因为DataFrame是一个带有标签的二维数组,每一个标签相当于每一列的列名。因此,可以以字典访问某一个Key值得方式使用对应的列名,实现单列数据的访问。

order_id = detail['order_id']
#order_id就是一个Series类型,本质上和一个一维数组一样,有类似的访问形式
type(order_id)

对单列多行数据的访问

dishes_name5 = detail['dishes_name'][:5] 
a=np.array(disher_name5,dtype='U8') # 去除了索引

对多行多列数据的访问

orderDish = detail[['order_id','dishes_name']][:5]

多列多行数据的访问:

orderDish = detail[:5][:5] #访问前五列前五行的函数 

loc,iloc访问方式

  • 使用loc方法和iloc实现多列切片,其原理的通俗解释就是将多列的列名或者位置作为一个列表或数据传入
  • 使用loc,iloc方法可以取出DataFrame中的任意数据
  • 在loc使用的时候内部传入的行索引名称如果为一个区间,则前后均为闭区间;iloc方法使用时内部传入的行索引位置或列索引位置为区间时,则为前闭后开区间。
  • loc内部还可以传入表达式,结果会满足表达式的所有值
dishes_name1 = datail.loc[:,'dishes_name']
dishee_name2 = datil.iloc[:,3]
orderDish1 = detail.loc[:,['order_id','dishes_name']]
orderDish2 = detail.iloc[:,[1,3]]
detail.loc[2:6,['order_id','dishes_name']]
detail.iloc[2:7,[1,3]]

3、更改DataFrame中的数据

# 将order_id为458的,变换成45800
detail.loc[detail['order_id']=='458','order_id'] = '45800'

4、增加DataFrame中的数据

  • DataFrame添加一列的方法非常简单,只需要新建一个列索引。并对该索引下的数据进行赋值操作。
  • 新增的一列值是相同的则直接赋值一个常量即可
# 两个列进行相乘之后赋值给新的列
detail['payment'] = detail['counts']*detail['amounts']
# 直接赋值为常量,则该列都是相同的值
detail['pay_way'] = '现金支付'

删除DataFrame中的数据

drop(labels,axis=0,level=None,inplace=False,error='raise')
# labels:接收string或array
# axis:代表操作轴向,0或1
# levels: 接收int或者索引名,代表标签所在级别
# inplace: 接收Boolean,代表操作是否对原数据生效

例:

detail.drop[lebels = 'pay_way',axis = 1,inplace = True] # 将pay_way这一列删除掉,对原数据生效
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值