第1关:数据过滤
任务描述
本关任务:编写一个能过滤非数值类和含异常值的数据类型的小程序。
相关知识:
为了完成本关任务,你需要掌握如何利用 pandas 库过滤数据。
pandas过滤数据
pandas 是一个强大的分析结构化数据的工具集;它的使用基础是 Numpy (提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。
Pandas 中常见的数据结构有两种:
Series:
构建 Series:ser_obj = pd.Series(range(10));
由索引和数据组成:索引在左<自动创建的>,数据在右;
获取数据和索引: ser_obj.index; ser_obj.values;
预览数据: ser_obj.head(n);ser_obj.tail(n)。
DataFrame:
获取列数据: df_obj[col_idx]或df_obj.col_idx;
增加列数据: df_obj[new_col_idx] = data;
删除列: del df_obj[col_idx];
按值排序: sort_values(by = “label_name”)。
编程要求
请仔细阅读右侧代码,结合相关知识,在 Begin-End 区域内进行代码补充,读取数据、过滤非数值类和含异常值的数据并输出过滤的数据。
测试说明
平台会对你编写的代码进行测试:
部分测试输入:
预期输出: