pandas数据处理工具

最新推荐文章于 2021-12-15 17:13:16 发布

暮丶凉

最新推荐文章于 2021-12-15 17:13:16 发布

阅读量165

点赞数

分类专栏：数据处理

本文链接：https://blog.csdn.net/qq_19457459/article/details/104732354

版权

数据处理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

pandas概览

Pandas 是 Python 的核心数据分析支持库，提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具，其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。

pandas简单运用

导入pandas库

import pandas as pd

读取csv文件：pd.read_csv('路径')
写入csv文件：pd.to_csv('路径')

创建pandas表格：
labels和imgs 均为numy数组类型

dataframe = pd.DataFrame('face_names': labels,
                          'face_imgs': imgs})

打印结果

    trainortest           face_names                    face_imgs
0       train          Tracy_Wyle/          Tracy_Wyle_0001.jpg
1       train      Martie_Maguire/      Martie_Maguire_0001.jpg
2       train  Wanda_Ilene_Barzee/  Wanda_Ilene_Barzee_0001.jpg
3       train       Alain_Ducasse/       Alain_Ducasse_0001.jpg
4        test         Steve_Avery/         Steve_Avery_0001.jpg
5        test        Johnnie_Lynn/        Johnnie_Lynn_0001.jpg
6        test    Sananda_Maitreya/    Sananda_Maitreya_0001.jpg

选择只包含‘train’的行为新的表格

 df2 = df[df.trainortest == 'train']

打印结果

   trainortest           face_names                    face_imgs
0       train          Tracy_Wyle/          Tracy_Wyle_0001.jpg
1       train      Martie_Maguire/      Martie_Maguire_0001.jpg
2       train  Wanda_Ilene_Barzee/  Wanda_Ilene_Barzee_0001.jpg
3       train       Alain_Ducasse/       Alain_Ducasse_0001.jpg

选择某一列

df['列标签']
df.列标签

根据标签选择数据

 df.loc[i, '标签']

遍历每一行数据

for i in range(len(df)):
    face_name = df.loc[i, 'face_names']
    face_img = df.loc[i, 'face_imgs']

pandas数据合并

df,df_new 为两个需要合并的pandas表格
sort是否重新排序，ignore_index:是否忽略索引值，为true时生成新的索引值
pd.concat() 将新合并的表格返回

 result = pd.concat([df, df_new], sort=False, ignore_index=True)

pandas 删除某一行

labels:需要删除的索引
axis：axis=0为行，axis=1为列（默认为0）
inplace：是否更改原数据

df_new.drop(labels=idx, axis=0, inplace=True)

暮丶凉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录