机器学习的数据类型有哪几种?每种数据类型对应的合法操作有哪些?为什么?
机器学习中数据的常见类型为如下四种:
大的来说有两类:
- 数值型:连续属性 (continuous attribute)在定义域上有无穷多个可能的取值。属于定量数据(Quantitative data)包含定距数据(interval data)和定比数据(ratio data);
- 标称型或者分类型:离散属性 (categorical attribute)在定义域上是有限个可能的取值。属于定性数据(Qualitative data)包含定类数据和定序数据;
小的来说有四类:
Nominal,Ordinal,Interval and Ratio分别是定类、定序、定距、定比数据。
等距数据&#