pandas概览
Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。
pandas简单运用
导入pandas库
import pandas as pd
读取csv文件:pd.read_csv('路径')
写入csv文件:pd.to_csv('路径')
创建pandas表格:
labels和imgs 均为numy数组类型
dataframe = pd.DataFrame('face_names': labels,
'face_imgs': imgs})
打印结果
trainortest face_names face_imgs
0 train Tracy_Wyle/ Tracy_Wyle_0001.jpg
1 train Martie_Maguire/ Martie_Maguire_0001.jpg
2 train Wanda_Ilene_Barzee/ Wanda_Ilene_Barzee_0001.jpg
3 train Alain_Ducasse/ Alain_Ducasse_0001.jpg
4 test Steve_Avery/ Steve_Avery_0001.jpg
5 test Johnnie_Lynn/ Johnnie_Lynn_0001.jpg
6 test Sananda_Maitreya/ Sananda_Maitreya_0001.jpg
选择只包含‘train’的行为新的表格
df2 = df[df.trainortest == 'train']
打印结果
trainortest face_names face_imgs
0 train Tracy_Wyle/ Tracy_Wyle_0001.jpg
1 train Martie_Maguire/ Martie_Maguire_0001.jpg
2 train Wanda_Ilene_Barzee/ Wanda_Ilene_Barzee_0001.jpg
3 train Alain_Ducasse/ Alain_Ducasse_0001.jpg
选择某一列
df['列标签']
df.列标签
根据标签选择数据
df.loc[i, '标签']
遍历每一行数据
for i in range(len(df)):
face_name = df.loc[i, 'face_names']
face_img = df.loc[i, 'face_imgs']
pandas数据合并
df,df_new 为两个需要合并的pandas表格
sort是否重新排序,ignore_index:是否忽略索引值,为true时生成新的索引值
pd.concat() 将新合并的表格返回
result = pd.concat([df, df_new], sort=False, ignore_index=True)
pandas 删除某一行
labels:需要删除的索引
axis:axis=0为行,axis=1为列(默认为0)
inplace:是否更改原数据
df_new.drop(labels=idx, axis=0, inplace=True)