dataframe pandas 新建_pandas 入门:DataFrame的创建,读写,插入和删除

不得不说DataFrame现在很火,已经有很多库都是基于DataFrame写的,而且它用起来也很方便,读excel只需要一行代码,起使用xlrd的日子,至今还脑壳疼,所以对于一个用python做数据处理的人来说,pandas是必须要了解的。对于一个数据处理工具来说,读写是最基本的,下面是我最近整理的关于pandas一些基本本操作,主要包括以下内容:

如何创建DataFrame

如何读取DataFrame的值,读一行/列、读多行/列

如何对DataFrame赋值

如何对DataFrame插入一(多)行/列

如何删除DataFrame的一(多)行/列

开始前先引入两个库

import pandas as pd

import numpy as np

1 创建DataFrame

1.1 利用字典创建

data={"one":np.random.randn(4),"two":np.linspace(1,4,4),"three":['zhangsan','李四',999,0.1]}

df=pd.DataFrame(data,index=[1,2,3,4])

如果创建df时不指定索引,默认索引将是从0开时,步长为1的数组。

df的行、列可以是不同的数据类型,同行也可以有多种数据类型。

df创建完成好可以重新设置索引,通常用到3个函数:set_index、reset_index、reindex。

set _index用于将df中的一行或多行设置为索引。

df.set_index(['one'],drop=False) ordf.set_index('one)

df.set_index(['one','two'])

参数drop默认为True,意为将该列设置为索引后从数据中删除,如果设为False,将继续在数据中保留该行。

如果要设置的索引不在数据中,可以通过

df.index=['a','b','c','d']

reset_index用于将索引还原成默认值,即从0开始步长为1的数组。

df.reset_index(drop=True)

参数drop默认值为False,意为将原来的索引做为数据列保留,如果设为True,原来的索引会直接删除。

reindex比较复杂,也不常用到,这里是基础篇,不做大量说明,感兴趣的朋友可以看官方文档

1.2 利用数组创建

data=np.random.randn(6,4)#创建一个6行4列的数组

df=pd.DataFrame(data,columns=list('ABCD'),index=[1,2,'a','b','2006-10-1','第六行'])

1.3 创建一个空DataFrame

pd.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值