3.pandas练习题（数据处理）

菠萝橡皮刀

已于 2023-03-17 17:26:06 修改

阅读量359

点赞数 1

文章标签： pandas python

于 2023-03-14 09:37:41 首次发布

本文链接：https://blog.csdn.net/m0_58420188/article/details/129498824

版权

1.pandas数据处理

1.查看前五行

data.head()

2.将salary列数据转换为最大值与最小值的平均值

# 定义函数
def func(df):
    list=df["salary"].split("-")
    min=int(list[0].strip("k"))
    max=int(list[1].strip("k"))
    df["salary"]=int((min+max)/2*1000)
    return df

df=df.apply(func,axis=1)

3.数据根据学历进行分组并计算平均薪资

df.groupby("education").mean()

4.将createTime列时间转换为月-日

for i in range(len(df)):
    df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime("%m-%d")

5.查看数值型列的汇总统计

df.descirbe()

6..新增一列根据salary将数据分为三组

df["catagories"]=pd.cut(df["salary"],
                 bins=[0,5000,20000,50000],
                 labels=["低","中","高"])

7.按照salary列对数据降序排列

df.sort_values("salary",ascending=False)

8.绘制薪资水平密度曲线

df.salary.plot(kind='kde',xlim=(0,80000))  # 指横坐标的范围

9.删除最后一列categories

del df["categories"]

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

菠萝橡皮刀

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
3.pandas练习题（数据处理）

复习
复制链接

扫一扫

第5章使用pandas进行数据预处理课后习题

SeNiLS的博客

07-09

1万+

1.选择题 (1)数据质量包含的要素有(D) A.准确性、完整性 B.一致性、可解释性 C.时效性、可信性 D.以上所有要素 (2)以下关于数据分析预处理的过程描述正确的是(D) A.数据清洗包括了数据标准化、数据合并和缺失值处理 B.数据合并按照合并轴方向主要分为左连接、右连接、内连接和外连接 C.数据分析的预处理过程主要包括数据清洗、数据合并、数据标准化和数据转换，他们之间存在交叉，没有严格的先后关系 D.数据标准化的主要对象是类别型的特征 (3)有一份数据，需要查看数据的类型，并将部分数据做强制类型转

Pandas练习题及notebook源码.zip

04-24

本资源包含了一份详尽的Pandas练习题集，总计120题，涵盖了Pandas的基础操作、数据清洗、数据处理、数据聚合、时间序列分析等多个方面。此外，还提供了Jupyter Notebook源码，使得学习者可以直观地看到代码执行过程...

参与评论您还未登录，请先登录后发表或查看评论

Pandas十大练习题，掌握常用方法

热门推荐

Rango_lhl的博客

10-04

1万+

CSDN广告多，以后都是在博客园写，这边转载： https://www.cnblogs.com/rango-lhl/p/9729334.html ------------------------------------------------------------------------------------------------------------------------------...

Pandas综合练习题一

01-04

在这个“Pandas综合练习题一”中，我们将深入探讨四个关键知识点：查看数据表基本信息、处理重复数据、处理异常值以及处理缺失值。每个部分都至关重要，因为它们直接影响到数据的准确性和分析结果的有效性。首先，...

Pandas——练习题二——数据集

07-25

在Pandas练习中，我们经常涉及到数据预处理，包括缺失值处理、异常值检测、数据类型转换等。例如，处理缺失值可以使用`fillna()`或`dropna()`函数，而将字符串数据转换为数值型可以使用`pd.to_numeric()`。数据...

pandas可视化练习数据.rar

05-03

在数据分析领域，Pandas库是Python编程语言中的一个核心工具，它提供了强大的数据处理和分析功能。Matplotlib则是Python中最常用的绘图库，用于生成各种静态、动态甚至交互式的图表。当这两个库结合使用时，我们可以...

Python-pandas基础习题与答案

07-06

Python中的pandas与matplotlib,numpy等库进行数据分析的一些基础代码。

Pandas——练习题一：在校生饮酒消费数据分析

07-25

在本实践练习中，我们将深入探索使用Pandas库对在校生饮酒消费数据进行分析。Pandas是Python编程语言中一个强大的数据分析工具，以其易用性和高效性而受到数据科学家和分析师的广泛欢迎。通过这个练习，我们将熟悉...

pandas数据处理练习（基础且详细二十岁老汉在线扣字）

weixin_52818823的博客

07-12

227

在学习pandas以及matplotlib库用法的过程中，尝试了对数据进行处理以及可视化，在此记录下近期实例，以期复习使用

数据分析-Pandas基础使用及练习

程序员不鸣的博客

04-10

1192

数据分析_Pandas基础练习题9道（附数据）

weixin_46578004的博客

10-27

6283

'''目标：修复数据中异常时间的数据，将异常时间数据统一减少100实现方式：自定义函数1.观察数据找到异常数据所在处：“Yr_Mo_Dy”2.查看“Yr_Mo_Dy”数据类型：datetime643.提取异常的内容：提取日期中的年份4.将提取出来的年份减去1005.将处理好的年份拼接月份和天数的信息:datetime.date()用于拼接年份月份以及天数6.返回处理后的日期（年月日）

【头歌】综合训练项目2：pandas数据分析

one_D的博客

06-17

6151

综合训练项目2：pandas数据分析

Pandas数据载入与预处理期末复习

qq_51250393的博客

12-13

775

对于数据分析而言，数据大部分来源于外部数据，如常用的CSV文件、Excel文件和数据库文件等。Pandas库将外部数据转换为DataFrame数据格式，处理完成后再存储到相应的外部文件中。 Pandas 常用的导入格式：import pandas as pd 1.文本文件读取文本文件是一种由若干行字符构成的计算机文件，它是一种典型的顺序文件。 txt文件：是Windows操作系统上附带的一种文本格式，文件以.txt为后缀。 CSV文件：是Comma-Separated Values的缩写，用...

pandas练习

weixin_48302334的博客

01-31

435

pandas练习

数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（2）

小鱼干儿的博客

10-27

3925

DataFrame存储为Excel，查看数据行列数,提取popularity列中值大于3小于7的行、交换两列的位置、提取popularity列最大的行所在行、查看最后3行数据、删除最后一行数据、添加一行数据、队数据按照popularity列的值的大小进行排序、统计grammer列每个字符串的长度

pandas 数据处理练习题

09-27

pandas 数据处理练习题包括查看数据表基本信息操作、重复数据处理操作、异常值处理操作、缺失值处理操作和提取其他关键信息补全字段操作。在处理数据时，你可以使用Pandas和NumPy库来读取和处理数据。你可以使用`pd....

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交