Data Preprocessing(数据预处理)
核心问题:
1.数据是杂乱无章?
2.数据不能直接来进行分析?
3.打好地基?
主要点:
1.Data Cleaning
2.Data Transformation
3.Data Description
4.Feature Selection
5.Feature Extraction
数据从哪里来?
金融数据,信息数据,GPS,手环等等,格式不仅相同。
为什么要进行数据预处理?
1.数据不完整?(Incomplete)
2.Noisy
3.Inconsistent
4.Redundant
5.Different Type
6.Not Applicable(N/A)
7.Data not provided