-
目录
-
实验目的
通过完成本实验,应掌握以下知识或技能:
- 掌握数据清理的办法,包括缺失值检测、缺失值处理、异常值检测、异常值处理
- 掌握离散数据的二进制编码方法,数据规范化方法,数据转换的方法
-
实验知识点
- Python的常见语法
- 使用dataframe的boxplot方法画箱型图进行可视化展示,对缺失值及异常值进行处理。
- 使用OneHotEncoder()独热编码,创建哑变量
-
实验环境
名称 |
版本 |
|
系统环境 |
Windows系统 |
Windows10 |
开发环境 |
Anaconda |
Anaconda 3.6 |
运行环境 |
Python |
Python 3.8 |
-
实验数据
泰坦尼克号数据集
-
实验步骤
本实验对数据进行缺失值、异常值的处理,并将类别型数据转换为哑变量
本实验可以分为以下4个步骤:
-
读取数据为dataframe