数据预处理之“分类”数据离散化
数据预处理之“分类”数据离散化大多数机器学习算法不能识别类别数据,要求数据必须是数值型的,故作为一名合格的MLer必须对相应转换方法有所了解。以性别为例,性别特征具有两个选项:男或女,机器学习模型搞不懂何为“男 、女”,但清楚何为“1、0”。直观的做法,将“男、女”对“1、0”进行映射,即sex∈(0,1)sex \in (0,1),但这种做法存在一个明显的缺陷,即“0 、1”具有大小可比性,而实际
原创
2016-10-27 17:07:29 ·
3737 阅读 ·
0 评论