Pandas核心操作

1. 读取CSV/Excel格式的数据 

1. pd.read_csv("csv文件路径")

2. pd.read_excel("excel文件路径")

 2. 将DataFrame写入CSV文件

1. df.to_csv("data.csv",index=False)  #不带索引

 3. DataFrame基本信息

1. df.info()  #数据框基本信息  

2. df.describe()  #数据框统计信息

3. df.columns  #列出所有列名

4. df.min()

5. df.max()

6. df.idxmin()  #最小值的索引

7.df.idxmax()  #最大值的索引

8.df.sum()

9.df.mean()

4. 数据处理

1. df.dropna(axis=0,how='any')  #删除包含任何NaN值,how='all' 删除所有元素都为NaN的给定轴

2. df.replace(to_replace=None,value=None)  #用value的值替换to_replace的值

3. df.drop('eature_name',axis=0或1)  #0代表行,1代表列

4. df.as_matrix()  #将DataFrame转换为数组

5. df.head(n)  #取前n行

6. df.loc[feature_name]  #通过特征名取数据

7. df.["height"].apply(lambda height:n*height)  #将height行的所有值乘n

8. df.rename(columns={df.columns[n]:'newname'},inplace=True)  #将第n行名称改为newname

9. new_df=df[["name","size"]]  #将DataFrame选取行name和size

10. df.sort_values(by='column',ascending=False)  #数据排序

11. df.loc([0],['name'])  #选取第一行,name列的值

12. df.groupby(by=["label"]).agg({'sales':sum}).reset_index()  #将label列中的相同值对应sales列的值求和

5.reindex

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值