简单分享下pandas

基础库,从了解到熟悉

首先需要用到的库,需要优先导入,并且创建一个DataFrame对象。这里我们使用字典来创建一个简单的DataFrame:

import pandas as pd

data = {
    '姓名': ['张三', '李四', '王五', '赵六'],
    '年龄': [25, 30, 35, 40],
    '性别': ['男', '女', '男', '女']
}

df = pd.DataFrame(data)

接下来,我们将介绍pandas常用的35个经典操作:

  1. 查看数据前5行:

print(df.head())
  1. 查看数据信息(如数据类型、非空值数量等):

print(df.info())
  1. 查看数据描述性统计信息(如均值、标准差等):

print(df.describe())
  1. 查看数据列名:

print(df.columns)
  1. 查看数据索引:

print(df.index)
  1. 按列名选择数据:

print(df['姓名'])
  1. 按列名修改数据:

df['姓名'] = ['张三丰', '李四光', '王五岳', '赵六令']
print(df)
  1. 按条件筛选数据:

filtered_df = df[df['年龄'] > 30]
print(filtered_df)
  1. 按条件修改数据:

df.loc[df['年龄'] > 30, '年龄'] = 31
print(df)
  1. 按条件删除数据:

df = df[df['年龄'] != 31]
print(df)
  1. 添加新列:

df['城市'] = ['北京', '上海', '广州', '深圳']
print(df)
  1. 删除列:

df = df.drop('城市', axis=1)
print(df)
  1. 重命名列:

df = df.rename(columns={'姓名': '名字'})
print(df)
  1. 设置索引:

df = df.set_index('名字')
print(df)
  1. 重置索引:

df = df.reset_index()
print(df)
  1. 排序:

sorted_df = df.sort_values(by='年龄')
print(sorted_df)
  1. 分组:

grouped_df = df.groupby('性别')
print(grouped_df.mean())
  1. 合并:

data2 = {'名字': ['孙悟空', '猪八戒'], '年龄': [500, 400], '性别': ['男', '男']}
df2 = pd.DataFrame(data2)
merged_df = pd.concat([df, df2])
print(merged_df)
  1. 插入数据:

df.loc[1.5] = ['唐僧', 25, '男']
print(df)
  1. 删除数据:

df = df.drop([1, 2])
print(df)
  1. 填充缺失值:

df['年龄'] = df['年龄'].fillna(30)
print(df)
  1. 去除重复值:

df = df.drop_duplicates()
print(df)
  1. 数据透视表:

pivot_table = pd.pivot_table(df, values='年龄', index='名字', columns='性别')
print(pivot_table)
  1. 数据转置:

transposed_df = df.T
print(transposed_df)
  1. 数据合并(按行):

df3 = pd.DataFrame({'名字': ['白龙马'], '年龄': [300], '性别': ['男']})
merged_df = pd.merge(df, df3, on='名字')
print(merged_df)
  1. 数据合并(按列):

merged_df = pd.merge(df, df3, left_index=True, right_index=True)
print(merged_df)
  1. 数据连接(按行):

connected_df = pd.concat([df, df3])
print(connected_df)
  1. 数据连接(按列):

connected_df = pd.concat([df, df3], axis=1)
print(connected_df)
  1. 数据切片:

sliced_df = df[1:3]
print(sliced_df)
  1. 数据迭代:

for index, row in df.iterrows():
    print(row)
  1. 数据过滤:

filtered_df = df[(df['年龄'] > 25) & (df['性别'] == '男')]
print(filtered_df)
  1. 数据替换:

df['性别'] = df['性别'].replace('男', 'M')
print(df)
  1. 数据映射:

mapping = {'男': 'M', '女': 'F'}
df['性别'] = df['性别'].map(mapping)
print(df)
  1. 数据透视表(多重索引):

pivot_table = pd.pivot_table(df, values='年龄', index=['名字', '性别'])
print(pivot_table)
  1. 数据透视表(聚合函数):

pivot_table = pd.pivot_table(df, values='年龄', index='名字', columns='性别', aggfunc='mean')
print(pivot_table)

本文介绍了pandas常用的35个基础操作。包括数据筛选、修改、删除、分组、合并、连接、透视表等。通过这些操作,我们可以对数据处理分析。在实际应用中,我们可以根据需要选择合适的操作来满足我们的需求。

  • 5
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: PandasPython编程语言的一个开源数据分析和数据处理库。它提供了丰富的数据结构和功能,使得数据分析任务更加简单和高效。而Xmind是一种思维导图工具,可以帮助用户组织和展示复杂概念和信息。 Pandas库结合了NumPy的功能和扩展了更高级的数据结构,最重要的是它的数据结构--Dataframe。Dataframe是一个二维的表格型数据结构,类似于数据库表或Excel中的表格。它提供了各种方法来处理和操纵这些表格数据,包括数据的索引、选择、过滤、排序、分组等。 使用Pandas库可以读取和写入多种数据格式,如CSV、Excel、SQL数据库等。通过Pandas的数据结构,用户可以进行数据清洗和转换,处理缺失数据、重复数据、异常数据等。此外,Pandas还提供了强大的时间序列处理功能,可以进行时间索引、频率转换、滞后、移动窗口等操作。 在数据分析方面,Pandas提供了各种统计计算的方法,如平均值、标准差、协方差、相关系数等。同时,Pandas库还能够进行数据可视化,通过绘图的方式展示数据的分布、趋势和关联关系。这使得数据分析师可以更加直观地理解和解释数据。 Xmind是一种用于创建思维导图的工具,它可以将复杂的概念和信息以图形化的方式展示出来。思维导图可以帮助用户整理和梳理思路,帮助用户更好地理解和记忆知识。在使用Pandas进行数据分析时,可以使用Xmind来记录和整理自己的数据分析过程,包括数据处理的步骤、分析的结果和相关的观察或发现。这样可以帮助用户更好地管理和沟通数据分析的过程和结果。 总结来说,Pandas是一个功能强大的数据分析和处理库,通过其丰富的数据结构和方法,可以简化和高效完成各种数据分析任务。而Xmind则是一种思维导图工具,能够帮助用户整理和展示复杂概念和信息,方便用户将数据分析过程和结果进行可视化和整理。使用Pandas和Xmind可以让数据分析任务更加简单和直观。 ### 回答2: Pandas是一个开源的Python数据分析库,它提供了丰富的数据结构和数据分析工具,使得数据处理更加简单、高效。而Pandas库中的核心数据结构是DataFrame,可以理解为一个二维的表格数据,类似于Excel中的数据表。Xmind是一款思维导图软件,可以帮助我们更好地组织和展示思维。 Pandas可以通过Xmind来进行详解,主要包括以下几个方面: 1. DataFrame的创建和基本操作:可以通过读取文件、字典、Numpy数组等方式来创建DataFrame,然后可以进行数据的选取、切片、筛选等操作。 2. 数据的清洗和处理:Pandas提供了强大的数据清洗和处理功能,可以用来处理缺失数据、重复数据以及异常值。也可以进行数据的合并、拆分、排序等操作,以及字符串、时间序列、数值等类型的转换。 3. 数据的分组和聚合:Pandas的分组和聚合功能非常强大,可以进行按列或者按行的分组操作,然后对每一组数据进行一些聚合操作,如求和、计数、平均值等。这样可以更好地了解数据的分布和概况。 4. 数据的可视化:Pandas可以配合Matplotlib等数据可视化工具,对数据进行绘图和可视化操作。可以绘制线图、柱状图、饼图等各种图表,更直观地展示数据的特征和趋势。 综上所述,使用Pandas库可以更方便地进行数据分析和处理,而通过Xmind来详细说明Pandas的各种功能和操作,能够更好地帮助用户理解和应用这些功能,从而更高效地进行数据分析和处理。 ### 回答3: Pandas是一个Python库,专门用于数据分析和数据操作。它提供了高效的数据结构和数据分析工具,使得使用Python进行数据处理变得更加方便和快速。而Xmind是一款脑图软件,用于整理和组织复杂的思维结构。 Pandas提供的数据结构主要包括两种:Series和DataFrame。Series是一维的带有标签的数组,类似于传统的数组或列表。每个元素都有唯一的标签,可以通过标签进行索引取值,方便进行数据查找和操作。DataFrame则是二维的表格型数据结构,类似于关系型数据库中的表。它由多个Series组成,每个Series代表一列数据。DataFrame可以进行行列索引、数据选择和过滤,方便进行数据的清洗和分析。 Pandas提供了丰富的数据操作和分析工具。可以进行数据的读取、清洗、转换和处理。可以对数据进行切片、聚合、排序和合并等操作。还可以对数据进行统计分析、绘图和可视化。Pandas还支持对缺失数据的处理,能够灵活处理数据中的空值,并进行填充或删除操作。 Xmind是一款强大的思维导图软件,可以帮助用户将复杂的信息整理、组织和展示。用户可以使用Xmind创建思维导图来表示数据结构、函数关系、工作流程等。通过将Python中的Pandas库和Xmind结合使用,可以更好地理解和展示数据分析的过程。可以使用脑图绘制数据处理流程图,方便团队内部的交流和理解。同时,可以使用脑图来整理数据分析中的关键知识点和技巧,方便进行知识传递和分享。 综上所述,PythonPandas库提供了便捷的数据处理和分析工具,而Xmind则可以辅助整理和展示数据分析的过程和结果。两者结合使用,可以帮助用户更好地进行数据分析和可视化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小软件大世界

谢谢支持,我将会更加努力的寻找

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值