Pandas模块-DataFrame

本文介绍了如何使用pandas创建DataFrame,包括从数组、numpy随机数和字典初始化。还讨论了DataFrame的常用属性如.index,.columns,.values和.shape。接着详细阐述了DataFrame的索引和切片操作,包括loc和iloc的区别,以及如何选取行、列和单个元素。
摘要由CSDN通过智能技术生成

1)DataFrame的创建

DataFrame既有行索引 index,也有列索引 column,值:Value,是表格型的数据结构

from Pandas import DataFrame

数组 df=DataFrame(data=[[1,2,4],[2,3,4]])

numpy df=DataFrame(data=numpy.random.randint(0,100),size=(6,4)))

字典  dic={"name":['zhangsan','lisi','wangwu'],"salary":[1000,2000,300]}

df=DataFrame(data=dic,index=['a','b','c']) 字典当中的key做了列索引,index指定了行索引

2)常用属性  .index  .columns .values .shape 

.dtype会报错。DataFrame是表格型数组,所以可以存储多种数据类型

3)索引和切片:

3.1索引

如果有显示索引,通过索引机制取行和列的时候,只能用显示索引,即直接要用索引名

df['name']:取单列

df['name','salary']: 取多列

df.iloc[0]:取单行

df.iloc[[0,3,5]]:取多行

iloc:表示通过隐式索引取行  loc:表示通过显示索引取行,若果原始数据有显示索引,要用loc

df.iloc[0,2] :取单个元素,其中0表示行,2表示列

df.loc[显示索引,显示索引] :取单个元素,其中0表示行,2表示列

df.iloc[[1,3,5],2]:取多个元素 第1,3,5行中第2列的值

3.2切片

df[0:2]  切行,与索引正好相反

df.iloc[:,0:2] 切列 ,iloc切隐式索引

如果series和datafram设置了显示索引,隐式索引也是存在的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值