Task 1:数据预处理
前记
这个系列的任务主要是记录了datawhale 组织的关于 data mining的学习的记录,学习完这个系列的内容,可以基本了解数据分析的技能。
简介
这个任务任务主要是关于以下内容的完成:
- 数据类型的分析
- 无关特征删除
- 数据类型转换
- 缺失值处理
- 数据切分
主要是对于pandas
相关函数的学习。
数据类型的分析
关于数据的分析,其实从导入数据的那一刻,就是在对数据进行分析,进行一个直观的理解。假设我们读入的pandas
的数据类型的对象为:data
那么查看数据类型的函数是:
>>data.info()
output:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4754 entries, 0 to 4753
Data columns (total 90 columns):
Unnamed: 0 4754 non-null int64
custid 4754 non-null int64
trade_no