pandas数据处理工具

pandas概览

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。

pandas简单运用

导入pandas库

import pandas as pd

读取csv文件pd.read_csv('路径')
写入csv文件pd.to_csv('路径')

创建pandas表格:
labels和imgs 均为numy数组类型

dataframe = pd.DataFrame('face_names': labels,
                          'face_imgs': imgs})

打印结果

    trainortest           face_names                    face_imgs
0       train          Tracy_Wyle/          Tracy_Wyle_0001.jpg
1       train      Martie_Maguire/      Martie_Maguire_0001.jpg
2       train  Wanda_Ilene_Barzee/  Wanda_Ilene_Barzee_0001.jpg
3       train       Alain_Ducasse/       Alain_Ducasse_0001.jpg
4        test         Steve_Avery/         Steve_Avery_0001.jpg
5        test        Johnnie_Lynn/        Johnnie_Lynn_0001.jpg
6        test    Sananda_Maitreya/    Sananda_Maitreya_0001.jpg

选择只包含‘train’的行为新的表格

 df2 = df[df.trainortest == 'train'] 

打印结果

   trainortest           face_names                    face_imgs
0       train          Tracy_Wyle/          Tracy_Wyle_0001.jpg
1       train      Martie_Maguire/      Martie_Maguire_0001.jpg
2       train  Wanda_Ilene_Barzee/  Wanda_Ilene_Barzee_0001.jpg
3       train       Alain_Ducasse/       Alain_Ducasse_0001.jpg

选择某一列

df['列标签']
df.列标签

根据标签选择数据

 df.loc[i, '标签']

遍历每一行数据

for i in range(len(df)):
    face_name = df.loc[i, 'face_names']
    face_img = df.loc[i, 'face_imgs']

pandas数据合并

df,df_new 为两个需要合并的pandas表格
sort是否重新排序,ignore_index:是否忽略索引值,为true时生成新的索引值
pd.concat() 将新合并的表格返回

 result = pd.concat([df, df_new], sort=False, ignore_index=True)

pandas 删除某一行

labels:需要删除的索引
axis:axis=0为行,axis=1为列(默认为0)
inplace:是否更改原数据

df_new.drop(labels=idx, axis=0, inplace=True)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值