【头歌】重生之我在py入门实训中（11）：Pandas初体验

垮起个老脸

已于 2022-05-12 20:20:58 修改

阅读量1.4w

点赞数 58

分类专栏：重生之我在头歌渡劫 Python 文章标签： python 开发语言

于 2022-04-30 17:41:39 首次发布

本文链接：https://blog.csdn.net/weixin_61800684/article/details/124515918

版权

重生之我在头歌渡劫同时被 2 个专栏收录

17 篇文章 77 订阅

订阅专栏

Python

15 篇文章 15 订阅

订阅专栏

本篇博客介绍了Pandas的基础操作，包括创建Series和DataFrame，数据导入，排序，删除，算术运算及去重。通过实例展示了如何创建series_a和series_b，建立五行三列的DataFrame df1，读取CSV文件并修改列名，对Series和DataFrame进行排序和删除操作，以及进行加法运算和去重操作。这些基本操作对于数据处理至关重要。

摘要由CSDN通过智能技术生成

创作不易，参考之前，点个赞，收藏，关注一下不过分吧，家人们

第1关：了解数据处理对象--Series

任务描述

本关任务：仔细阅读编程要求，完成相关要求。

------------------------------------------------------------------------

编程要求

根据提示，在右侧编辑器Begin-End处补充代码：

创建一个名为series_a的series数组，当中值为[1,2,5,7],对应的索引为['nu', 'li', 'xue', 'xi']；
创建一个名为dict_a的字典，字典中包含如下内容{'ting':1, 'shuo':2, 'du':32, 'xie':44}；

将dict_a字典转化成名为series_b的series数组。

 # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    series_a=Series([1,2,5,7],index=['nu', 'li', 'xue', 'xi'])
    dict_a={'ting':1, 'shuo':2, 'du':32, 'xie':44}
    series_b=Series(dict_a)

    # ********** End **********#

    # 返回series_a,dict_a,series_b
    return series_a,dict_a,series_b

第2关：了解数据处理对象-DataFrame

任务描述

本关任务：根据编程要求，完成相关代码的编写。

-------------------------------------------------------------------------

编程要求

根据提示，在右侧编辑器begin-end处补充代码：

创建一个五行三列的名为df1的DataFrame数组，列名为 [states,years,pops]，行名['one','two','three','four','five']；
给df1添加新列，列名为new_add，值为[7,4,5,8,2]。

 # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    dictionary={'states':['','','','',''],
            'years':['','','','',''],
            'pops':['','','','','']}
    df1=DataFrame(dictionary)
    df1=DataFrame(dictionary,index=['one','two','three','four','five'])
    df1['new_add']=[7,4,5,8,2]


    # ********** End **********#

第3关：读取CSV格式数据

任务描述

本关任务：根据编程要求，完成相关代码的编写。

-----------------------------------------------------

编程要求

根据提示，在右侧编辑器begin-end处补充代码：

将test3/uk_rain_2014.csv中的数据导入到df1中；
将列名修改为['water_year','rain_octsep','outflow_octsep','rain_decfeb', 'outflow_decfeb', 'rain_junaug', 'outflow_junaug']；

计算df1的总行数并存储在length1中。

   # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    df1=pd.read_csv('test3/uk_rain_2014.csv', header=0)
    df1.columns=['water_year','rain_octsep','outflow_octsep','rain_decfeb', 
                'outflow_decfeb', 'rain_junaug', 'outflow_junaug']
    length1=len(df1)

    # ********** End **********#
    #返回df1,length1
    return df1,length1

第4关：数据的基本操作——排序

编程要求

根据提示，在右侧编辑器Begin-End处补充代码：

对代码中s1进行按索引排序，并将结果存储到s2；

对代码中d1进行按值排序（index为f），并将结果存储到d2。

    # s1是Series类型数据，d1是DataFrame类型数据
    s1 = Series([4, 3, 7, 2, 8], index=['z', 'y', 'j', 'i', 'e'])
    d1 = DataFrame({'e': [4, 2, 6, 1], 'f': [0, 5, 4, 2]})

    # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    s2=s1.sort_index()
    d2=d1.sort_values(by='f')
    # ********** End **********#

第5关：数据的基本操作——删除

编程要求

根据提示，在右侧编辑器Begin-End处补充代码：

在s1中删除z行，并赋值到s2；

d1中删除yy列，并赋值到d2。

  # s1是Series类型数据，d1是DataFrame类型数据
    s1 = Series([5, 2, 4, 1], index=['v', 'x', 'y', 'z'])
    d1=DataFrame(np.arange(9).reshape(3,3), columns=['xx','yy','zz'])
    # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    s2=s1.drop('z')
    d2=d1.drop(['yy'],axis=1)

    # ********** End **********#

第6关：数据的基本操作——算术运算

编程要求

根据提示，在右侧编辑器Begin-End处补充代码：

让df1与df2相加得到df3，并设置默认填充值为4。

  # df1,df2是DataFrame类型数据
    df1 = DataFrame(np.arange(12.).reshape((3, 4)), columns=list('abcd'))
    df2 = DataFrame(np.arange(20.).reshape((4, 5)), columns=list('abcde'))

    # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    df3=df1.add(df2,fill_value=4)

    # ********** End **********#

    # 返回df3
    return df3

第7关：数据的基本操作——去重

编程要求

根据提示，在右侧编辑器Begin-End处补充代码:

去除df1中重复的行，并把结果保存到df2中。

   # df1是DataFrame类型数据
    df1 = DataFrame({'k1': ['one'] * 3 + ['two'] * 4, 'k2': [1, 1, 2, 3, 3, 4, 4]})
    # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    df2=df1.drop_duplicates()

    # ********** End **********#

    # 返回df2

第8关：层次化索引

编程要求

根据提示，在右侧编辑器Begin-End处补充代码:

对s1进行数据重塑，转化成DataFrame类型，并复制到d1。

  #s1是Series类型数据
    s1=Series(np.random.randn(10),
           index=[['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'], [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]])
    # 请在此添加代码 完成本关任务
    # ********** Begin *********#
    d1=s1.unstack()

    # ********** End **********#

    # 返回d1
    return d1

注：内容只做参考和分享，未经允许不可传播，侵权立删

垮起个老脸

关注

58
点赞
踩
107

收藏

觉得还不错? 一键收藏
0
评论
【头歌】重生之我在py入门实训中（11）：Pandas初体验

创作不易，参考之前，点个赞，收藏，关注一下不过分吧，家人们第1关：了解数据处理对象--Series任务描述本关任务：仔细阅读编程要求，完成相关要求。------------------------------------------------------------------------编程要求根据提示，在右侧编辑器Begin-End处补充代码：创建一个名为series_a的series数组，当中值为[1,2,5,7],对应的索引为['nu', 'li', 'xue',
复制链接

扫一扫

专栏目录