azw3 python数据分析活用pandas库_python数据分析处理库-Pandas

最新推荐文章于 2024-06-17 08:15:00 发布

君子作歌

最新推荐文章于 2024-06-17 08:15:00 发布

阅读量433

点赞数

文章标签： azw3 python数据分析活用pandas库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34174789/article/details/111969895

版权

本文介绍了如何使用Python的Pandas库进行数据分析，包括读取CSV数据、查看数据类型、显示数据、数据操作、处理缺失值、应用统计函数以及自定义函数等。示例涵盖了数据切片、数据乘法、新增列、排序、处理缺失值和应用自定义函数等操作。

摘要由CSDN通过智能技术生成

1、读取数据

import pandas

food_info = pandas.read_csv("food_info.csv")

print(type(food_info)) #

2、数据类型

3、数据显示

food_info.head() # 显示读取数据的前5行

food_info.head(3) # 显示读取数据的前3行

food_info.tail(3) # 显示读取数据的后3行

food_info.columns # 列名

food_indo.shape # 数据规格

food_info.loc[0] # 第0行数据

food_info.loc[3:6] # 第3-6行数据

food_info.log[83,"NDB_No"] # 读取第83行的NDB_No数据

food_info["NDB_No"] # 通过列名读取列

columns = ["Zinc_(mg)", "Copper_(mg)"]

food_info[columns] # 读取多个列

# 读取单位为g的列

col_names = food_info.columns.tolist() # 列名

gram_columns = []

for c in col_names:

if c.endswith("(g)"):

gram_columns.append(c)

gram_df = food_info[gram_columns]

4、数据操作

# 对该列每一个值都除以1000，+-*同理

food_info["Iron_(mg)"] / 1000

# 维度相同的列对应元素相乘

water_energy = food_info["Water_(g)"] * food_info["Energ_Kcal"]

# 添加新的一列

iron_grams = food_info["Iron_(mg)"] / 1000

food_info["Iron_(g)"] = iron_grams

# 最大值

food_info["Energ_Kcal"].max()

# 排序 inplace-是否新生成一个DataFrame ascending-默认为True

food_info.sort_values("Sodium_(mg)", inplace=True, ascending=False)

# 将排序后的数据的索引值重置，生成新的索引

new_titanic_survival = titanic_survival.sort_values("Age",ascending=False)

new_titanic_survival.reset_index(drop=True)

5、缺失值处理

# 缺失值

pd.isnull(age)

titanic_survival["Age"].mean() # 去掉缺失值后的平均值

#去掉含有缺失值的数据

titanic_survival.dropna(axis=1)# 丢掉含有缺失值的列

titanic_survival.dropna(axis=0,subset=["Age", "Sex"]) # 丢掉"Age"与"Sex"中含有缺失值的行

6、简单的统计函数

# 统计在不同船舱中获救人数的平均值 aggfunc-默认为求均值

passenger_survival = titanic_survival.pivot_table(index="Pclass", values="Survived", aggfunc=np.mean)

7、自定义函数

# 返回行值

def hundredth_row(column):

# Extract the hundredth item

hundredth_item = column.loc[99]

return hundredth_item

hundredth_row = titanic_survival.apply(hundredth_row)

# 置换列值

def which_class(row):

pclass = row['Pclass']

if pd.isnull(pclass):

return "Unknown"

elif pclass == 1:

return "First Class"

elif pclass == 2:

return "Second Class"

elif pclass == 3:

return "Third Class"

classes = titanic_survival.apply(which_class, axis=1)

8、Series结构

from pandas import Series

series_custom = Series(rt_scores , index=film_names)

series_custom[['Minions (2015)', 'Leviathan (2014)']]

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
azw3 python数据分析活用pandas库_python数据分析处理库-Pandas

1、读取数据import pandasfood_info = pandas.read_csv("food_info.csv")print(type(food_info)) # 2、数据类型3、数据显示food_info.head() # 显示读取数据的前5行food_info.head(3) # 显示读取数据的前3行food_info.tail(3) # 显示读取数据的后3行food_info.c...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。