作业要求
- [基础要求] 基于Jupyter Notebook 完成以下实验一、实验二、实验三;
- [重点要求] 修改以下示例代码,以测试不同知识点。在博客上写出你:
- 修改的代码、
- 修改的愿意(意图)
- 代码运行的结果
- 你的结论
实验一:Series对象的应用
实验要求:
- 定义一个Series对象,包含5个整数数据;
- 访问、修改Series对象中的数据;
- 打印Series对象;
- 对Series对象进行计算,如求和、求平均值等。
import pandas as pd
# 定义Series对象
data = pd.Series([1, 2, 3, 4, 5])
# 访问Series对象中的数据
print(data[2])
# 修改Series对象中的数据
data[2] = 6
# 打印Series对象
print(data)
# 对Series对象进行计算
print("总和:", data.sum())
print("平均值:", data.mean())
实验二:DataFrame对象的应用
实验要求:
- 定义一个DataFrame对象,包含3个列,每列分别为整数、浮点数和字符串类型;
- 访问、修改DataFrame对象中的数据;
- 对DataFrame对象进行计算,如求和、求平均值等。
import pandas as pd
# 定义DataFrame对象
data = {'整数': [1, 2, 3], '浮点数': [1.1, 2.2, 3.3], '字符串': ['a', 'b', 'c']}
df = pd.DataFrame(data)
# 访问DataFrame对象中的数据
print(df['整数'])
# 修改DataFrame对象中的数据
df['整数'][1] = 4
# 打印DataFrame对象
print(df)
# 对DataFrame对象进行计算
print("整数列总和:", df['整数'].sum())
print("整数列平均值:", df['整数'].mean())
print("浮点数列总和:", df['浮点数'].sum())
print("浮点数列平均值:", df['浮点数'].mean())
实验三:综合实例
实验要求:
- 定义一个包含省会城市、人口、GDP、城市面积的DataFrame对象;
- 计算各种排名,如人口最多的城市、GDP最高的城市等;
- 使用Pandas绘图,可视化上述实验结果。
import pandas as pd
import matplotlib.pyplot as plt
# 定义包含省会城市、人口、GDP、城市面积的DataFrame对象
data = {'城市': ['a', 'b', 'c'], '人口': [100, 200, 300], 'GDP': [300, 200, 100], '面积': [50, 60, 70]}
df = pd.DataFrame(data)
# 计算各种排名
max_population_city = df.loc[df['人口'].idxmax()]['城市']
print("人口最多的城市:", max_population_city)
max_gdp_city = df.loc[df['GDP'].idxmax()]['城市']
print("GDP最高的城市:", max_gdp_city)
# 使用Pandas绘图,可视化实验结果
df.plot(x='城市', y=['人口', 'GDP'], kind='bar', title='城市人口和GDP对比图')
plt.show()