2023(春)Python程序设计作业5:Pandas基础技能及综合应用

该文介绍了使用Python的Pandas库进行数据分析的基本操作,包括创建Series和DataFrame对象,访问和修改数据,计算统计量(如求和、平均值),以及利用Pandas进行数据排名和可视化。示例涵盖了数据访问、修改、计算和绘图的过程。
摘要由CSDN通过智能技术生成

实验一:Series对象的应用

实验要求:

  • 定义一个Series对象,包含5个整数数据;
  • 访问、修改Series对象中的数据;
  • 打印Series对象;
  • 对Series对象进行计算,如求和、求平均值等。
  • 代码:
  • import pandas as pd
    
    # 定义一个Series对象
    s = pd.Series([10, 20, 30, 40, 50])
    
    # 访问Series对象中的数据
    print(s[0])  # 输出第一个元素
    print(s[2:4])  # 输出第3个到第4个元素
    
    # 修改Series对象中的数据
    s[1] = 30
    
    # 打印Series对象
    print(s)
    
    # 对Series对象进行计算
    print(s.sum())  # 求和
    print(s.mean())  # 求平均值
    

    结果:

  •  

    实验二:DataFrame对象的应用

    实验要求:

  • 定义一个DataFrame对象,包含3个列,每列分别为整数、浮点数和字符串类型;
  • 访问、修改DataFrame对象中的数据;
  • 对DataFrame对象进行计算,如求和、求平均值等。
  • 代码:
  • import pandas as pd
    
    # 定义一个DataFrame对象
    data = {'int_col': [1, 2, 3, 4, 5], 'float_col': [1.2, 2.3, 3.4, 4.5, 5.6], 'str_col': ['a', 'b', 'c', 'd', 'e']}
    df = pd.DataFrame(data)
    
    # 访问DataFrame对象中的数据
    print(df['int_col'][0])  # 输出第一行第一列的数据
    print(df.loc[1, 'str_col'])  # 输出第二行第三列的数据
    
    # 修改DataFrame对象中的数据
    df.loc[2, 'float_col'] = 3.5
    
    # 对DataFrame对象进行计算
    print(df.sum())  # 求和
    print(df.mean())  # 求平均值

    结果:

 

实验三:综合实例

实验要求:

  • 定义一个包含省会城市、人口、GDP、城市面积的DataFrame对象;
  • 计算各种排名,如人口最多的城市、GDP最高的城市等;
  • 使用Pandas绘图,可视化上述实验结果。
  • 代码:
  • import pandas as pd
    import matplotlib.pyplot as plt
     
    # 定义一个包含省会城市、人口、GDP、城市面积的DataFrame对象
    data = {'city': ['北京', '上海', '广州', '深圳'], 'population': [2171, 2424, 1500, 1303], 
            'gdp': [30320, 32679, 20353, 22458], 'area': [16410, 6340, 7434, 1996]}
    df = pd.DataFrame(data)
     
    # 计算各种排名
    pop_rank = df['population'].rank(ascending=False)
    gdp_rank = df['gdp'].rank(ascending=False)
    area_rank = df['area'].rank(ascending=False)
     
    # 将排名添加到DataFrame对象中
    df['pop_rank'] = pop_rank
    df['gdp_rank'] = gdp_rank
    df['area_rank'] = area_rank
     
    # 使用Pandas绘图,可视化实验结果
    df.plot(kind='bar', x='city', y=['population', 'gdp', 'area'], title='China Capital Cities')
    plt.show()

    结果:

     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值