自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 第2关:多级索引的数据转换与累计方法

任务描述本关任务:根据相关知识完成编程要求并输出目标数据。相关知识多级索引行列转换使用多级索引的关键是掌握有效数据转换的方法,Pandas提供了许多操作,可以让数据在内容保持不变的同时,按照需要进行行列转换。上一关我们用stack()和unstack()演示过简单的行列转换,但其实还有许多合理控制层级行列索引的方法,让我们来一探究竟。 有序和无序的索引; 如果MultiIndex不是有序的索引,那么大多数切片操作都会失败,如下例: # 首先创建一个不按字典顺序排列的多级

2022-05-11 21:19:32 972

原创 第1关:多级索引的取值与切片

任务描述本关任务:根据相关知识以及编程要求,得到目标DataFrame多级索引。相关知识创建多级索引 通过MultiIndex构建多级索引: index = [('California', 2000), ('California', 2010), ('New York', 2000), ('New York', 2010), ('Texas', 2000), ('Texas', 2010)] populations = [33871648, 37253956, 1897

2022-05-11 21:18:24 2394

原创 第2关:Pandas缺失值类型

任务描述本关任务:根据所学知识完成右侧选择题。相关知识本关卡主要介绍Pandas自带的几个处理缺失值的工具的用法,该系列Pandas实训的缺失值主要有三种形式:null、NaN或NA。选择处理缺失值的方法一般情况下可以分为两种:一种方法是通过一个覆盖全局的掩码表示缺失值,另一种方法是用一个**标签值(sentinel value)**表示缺失值。 掩码方法中掩码可能是一个与原数组维度相同的完整布尔类型数组,也可能是用一个比特(0或1)表示有缺失值的局部状态; 标签方法中,

2022-05-11 21:15:17 1860 5

原创 第1关:Pandas数值运算方法

任务描述本关任务:获取鸢尾花数据集前30行并转换成DataFrame,然后让每一行都减去第一行的值,输出运算后的结果。相关知识Pandas在数值运算方面继承了NumPy的通用函数等功能,实现了一些高效技巧。通用函数:保留索引因为Pandas是建立在NumPy基础之上的,所以NumPy的通用函数同样适用于Pandas的Series和DataFrame对象。import numpy as np import pandas as pd rng = np.random.Ra

2022-05-11 21:13:41 4522 7

原创 第2关:DataFrame数据选择方法

任务描述本关任务:通过相关知识介绍的取值方法,得到目标DataFrame对象,具体要求请查看编程要求。相关知识将DataFrame看作字典DataFrame可以看作一个由若干Series对象构成的字典,可以通过对列名进行字典形式的取值获取数据。In: area = pd.Series({'California': 423967, 'Texas': 695662, 'New York': 141297, 'Florida': 170312, 'Illinois': 149995})

2022-05-11 21:11:44 2035

原创 第1关:Series数据选择

任务描述本关任务:根据相关知识,得到目标Series对象,具体要求请查看编程要求。相关知识Series对象与一维Numpy数组和标准Python字典在许多方面都一样。所以,Series对象的数据索引和选择模式与以上两种数据结构类似。Series数据选择方法与Python中的字典一样,Series对象提供了键值对的映射。In: import pandas as pd In: data = pd.Series([0.25, 0.5, 0.75, 1.0], index=['a

2022-05-11 21:09:44 2351

原创 第4关:Pandas的Index对象

任务描述本关任务:获取两个Series对象的Index对象,然后求它们的并集和交集。相关知识从以上几个实训可以看出Series和DataFrame对象都使用便于引用和调整的显式索引。Pandas的Index对象是一个很有趣的数据结构,可以将它看作是一个不可变数组或有序集合(实际上是一个多集,因为Index对象可能会包含重复值)。创建一个简单的Index对象:In: pd.Index([2, 3, 5, 7, 11]) Out: Int64Index([2, 3, 5, 7,

2022-05-11 20:54:24 747

原创 第3关:Pandas的DataFrame对象

任务描述本关任务:分别使用Series对象和字典类型数据创建一个DataFrame对象。相关知识Pandas的另一个基础数据结构是DataFrame。和上一节介绍的 Series对象一样,DataFrame既可以作为一个通用型NumPy数组,也可以看作特殊的Python字典。创建DataFrame对象Pandas的DataFrame对象可以通过许多方式创建,这里举几个常用的例子。通过数组创建: pd.DataFrame(array, index=list0, column

2022-05-11 20:52:45 2245

原创 第2关:Pandas的Series对象

任务描述本关任务:使用任意一个方法创建一个Series对象。相关知识Pandas的Series对象是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维数组,可以用一个数组创建Series对象。In: data = pd.Series([0.25, 0.5, 0.75, 1.0]) In: data Out: 0 0.25 1 0.50 2 0.75 3 1.00 dtype: float64 从上面的结果发现Series对象将一组数据和

2022-05-11 20:50:17 1970

原创 第1关:安装并使用Pandas

任务描述本关任务:输出Pandas的版本号。相关知识在安装 Pandas 之前,确保你的操作系统中有 NumPy。如果你是从源代码直接编译,那么还需要相应的工具编译建立 Pandas 所需的C语言与 Cython 代码。详细的安装方法,请参考 Pandas官方文档。如果你按照前言的建议使用了Anaconda,那么 Pandas 就已经安装好了。平台已经安装Anaconda,所以不需要再安装Pandas库。编程要求本关的编程任务是补全右侧编辑器中的demo()函数,要求通过__ver.

2022-05-11 20:17:58 1198 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除