pandas库的常用操作介绍

1.1.Pandas概述

Python的pandas库是一个数据处理和数据分析库,提供了很多强大的数据结构和处理工具,使得数据处理更加高效,同时也提供了丰富的功能和灵活的接口。pandas的两个核心数据结构是Series和DataFrame。Series是一个一维数组,可以保存任何数据类型,而DataFrame则是一个表格型数据结构,它包含了一系列的行和列,每列是Series类型。pandas提供了很多数据分析和处理工具,例如各种形式的数据清洗、数据过滤、数据筛选、数据分组、数据合并、数据重塑、时间序列数据处理、统计分析等。

  • 先导入pandas库
import pandas as pd
df=pd.read_csv('../teachercode/Pandas/data/titanic.csv')  # 读入文件中的表格数据
df.head()              # 使用此方法 默认显示前5行数据

在这里插入图片描述

df.head(10)# 可以选择显示前多上行

在这里插入图片描述

  • 查看我读入的表格数据在python中是什么类型数据
    在这里插入图片描述
  • info()函数获取这个DataFrame类型数据的具体信息

在这里插入图片描述
显示了有多少列,列名,每列非空数据数量,每列数据的类型,使用了多少内存。

  • 显示索引
    默认是显示行数n,索引就是0到n-1 我们可以自己指定一个标签列表设置为索引
    在这里插入图片描述
  • 显示列名
    在这里插入图片描述
  • 显示每列元素类型
    在这里插入图片描述
  • 简略的打印数据
    在这里插入图片描述
  • 自己创建一个简略的dataframe结构
    在这里插入图片描述
  • 取指定的数据,可以取指定的列 ,用列名做索引
    在这里插入图片描述
    在这里插入图片描述
  • 我们自己指定索引df.set_index()
    在这里插入图片描述
    这样并没有改变索引结果

在这里插入图片描述
在这里插入图片描述
使用df.set_intdex()后使用一个比变量来接受
在这里插入图片描述

  • 对拿到的列数据进行操作
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • describe 可以获取数据统计的基本统计信息特性
    在这里插入图片描述

2.Pandas索引结构

  • 可以按照列名取出特定列
    在这里插入图片描述
  • loc 使用标签来定位
  • iloc 使用位置来定位
    在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 可以改变特定位置的数据
    在这里插入图片描述
  • bool类型的索引
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.groupby学习

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

5.Pandas数值运算

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二元统计

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

6.对象操作

  • 对象查操作
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 改操作
    在这里插入图片描述
    在这里插入图片描述

  • Pandas 中的 rename() 函数用于重命名 DataFrame 或 Series 的行名称或列名称。它可以通过字典的方式来指定哪些行或列需要重命名
    在这里插入图片描述

  • 增操作
    在这里插入图片描述
    在这里插入图片描述

  • 删操作
    在这里插入图片描述
    在这里插入图片描述

  • DataFrame结构的增删改查
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

7.merge合并

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

显示设置

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

9.pivot操作

在Pandas中,pivot是一种数据重塑的操作,可以通过某些列作为行索引、某些列作为列索引和某些列来填充新创建的表格。

下面是一个示例,使用Pandas的pivot函数将一张数据表格重塑为一个新的表格。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

10. 时间操作

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
下面在pd.read_csv()中直接指定0列为索引并且本来这一类是字符串类型 直接设置parse_dates=True 就把字符串解析成Pandas中的时间类型

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

resample 重采样函数,对时间数据重新编排
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

11.常用操作

在这里插入图片描述

  • DataFrame.info()
    在这里插入图片描述
  • DataFrame.sort_values()
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

12.groupby操作

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

13.字符串操作

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

14.索引操作

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

15.pandas绘图操作

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PandasPython中一个强大的数据处理,它提供了一个灵活的数据结构DataFrame,用于数据清洗、转换、分析等操作。以下是一些常用Pandas命令: 1. **数据读取**: - `pd.read_csv(file_path)`:从CSV文件读取数据。 - `pd.read_excel(file_path)`:读取Excel文件。 - `pd.read_sql_query(sql, con)`:从SQL数据库查询数据。 2. **创建DataFrame**: - `pd.DataFrame(data, index=None, columns=None)`:根据数据创建DataFrame。 - `pd.DataFrame({'column1': data1, 'column2': data2}, index=...)`:指定列和索引。 3. **查看数据**: - `df.head()`:显示数据框的前几行。 - `df.tail()`:显示数据框的后几行。 - `df.info()`:显示数据的基本信息,包括每列的非空值数量等。 4. **数据清洗**: - `df.dropna()`:删除含有缺失值的行或列。 - `df.fillna(value)`:填充缺失值。 - `df.replace(to_replace, value)`:替换特定值。 5. **数据选择与切片**: - `df['column_name']`:选择单列数据。 - `df.iloc[row_index, column_index]`:按位置选择元素。 - `df.loc[row_label, column_label]`:按标签选择元素。 6. **数据操作**: - `df.groupby('column')`:按列分组。 - `df.merge(df2, on='key', how='inner')`:合并数据。 - `df.sort_values(by='column')`:按某列排序。 7. **数据统计**: - `df.describe()`:计算各数值列的统计摘要。 - `df.sum()`, `df.mean()`, `df.min()`, `df.max()`:计算各类统计量。 8. **数据透视表**: - `df.pivot_table(values='value_column', index='index_column', columns='column_column')`:创建数据透视表。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值