大多数机器学习算法不能识别类别数据,要求数据必须是数值型的,故作为一名合格的MLer必须对相应转换方法有所了解。
以性别为例,性别特征具有两个选项:男或女,机器学习模型搞不懂何为“男 、女”,但清楚何为“1、0”。直观的做法,将“男、女”对“1、0”进行映射,即 sex∈
大多数机器学习算法不能识别类别数据,要求数据必须是数值型的,故作为一名合格的MLer必须对相应转换方法有所了解。
以性别为例,性别特征具有两个选项:男或女,机器学习模型搞不懂何为“男 、女”,但清楚何为“1、0”。直观的做法,将“男、女”对“1、0”进行映射,即 sex∈