pandas中inplace_Pandas进阶修炼120题，给你深度和广度的船新体验

最新推荐文章于 2022-10-28 13:26:38 发布

达拉崩吧叭叭叭

最新推荐文章于 2022-10-28 13:26:38 发布

阅读量550

点赞数

文章标签： pandas中inplace

本文链接：https://blog.csdn.net/weixin_36487107/article/details/112194285

版权

来源：早起Python

本文约5800字，建议阅读15分钟。

本文为你介绍Pandas基础、Pandas数据处理、金融数据处理等方面的一些习题。

Pandas 是基于 NumPy 的一种数据处理工具，该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的函数和方法。和鲸社区的刘早起创作了这个项目，其中包含Pandas基础、Pandas数据处理、金融数据处理、当Pandas遇上NumPy、补充内容 5个部分。在深度和广度上，都相较之前的Pandas习题系列有了很大的提升。

此前的Pandas系列文章：

10套练习，教你如何用Pandas做数据分析
50道练习带你玩转Pandas
给Excel重度用户准备的Pandas教程：用Pandas逐帧还原20个Excel常用操作

以上3套，再加上现在这篇，各种姿势，各种体位基本都已经集齐了

希望榨干我一个，满足大家所有人，靴靴

Part 1 Pandas基础

1.将下面的字典创建为DataFrame

data = {
    "grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],"score":[1,2,np.nan,4,5,6,7,10]}
df = pd.DataFrame(data)
df

2.提取含有字符串"Python"的行

#方法一
df[df['grammer'] == 'Python']#方法二
results = df['grammer'].str.contains("Python")
results.fillna(value=False,inplace = True)
df[results]

3.输出df的所有列名

print(df.columns)

4.修改第二列列名为'popularity'

df.rename(columns={
    'score':'popularity'}, inplace = True)
df

5.统计grammer列中每种编程语言出现的次数

df['grammer'].value_counts()

6.将空值用上下值的平均值填充

df['popularity'] = df['popularity'].fillna(df['popularity'].interpolate())
df

7.提取popularity列中值大于3的行

df[df['popularity'] > 3]

8.按照grammer列进行去除重复值

df.drop_duplicates(['grammer'])

9.计算popularity列平均值

df['popularity'].mean()

10.将grammer列转换为list

df['grammer'].to_list()

11.将DataFrame保存为EXCEL

df.to_excel('test.xlsx')

12.查看数据行列数

df.shape

13.提取popularity列值大于3小于7的行

df[(df['popularity'] > 3) & (df['popularity'] 7)]

14.交换两列位置

# 方法1
temp = df['popularity']
df.drop(labels=['popularity'], axis=1,inplace = True)
df.insert(0, 'popularity', temp)
df# 方法2
cols = df.columns[[1,0]]
df = df[cols]
df

15.提取popularity列最大值所在行

df[df['popularity'] == df['popularity'].max()]

16.查看最后5行数据

df.tail()

17.删除最后一行数据

df.drop([len(df)-1],inplace=True)
df

18.添加一行数据['Perl',6.6]

row={
    'grammer':'Perl','popularity':6.6}
df = df.append(row,ignore_index=True)
df

19.对数据按照"popularity"列值的大小进行排序

最低0.47元/天解锁文章

达拉崩吧叭叭叭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas中inplace_Pandas进阶修炼120题，给你深度和广度的船新体验

来源：早起Python本文约5800字，建议阅读15分钟。本文为你介绍Pandas基础、Pandas数据处理、金融数据处理等方面的一些习题。Pandas 是基于 NumPy 的一种数据处理工具，该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的函数和方法。和鲸社区的刘早起创作了这个项目，其中包含Pandas基础、Pandas...
复制链接

扫一扫