一、分类的主要思想
分类是一种重要的数据分析形势,它提取刻画重要数据类的模型。这种模型称为分类器,预测分类(离散的、无序的)类标号。
例如:可以建立一个分类模型,把银行贷款申请划分成“安全”或"危险";销售数据的“是”或“否”;等等。这些类别可以用离散值表示,其中值之间的次序没有意义。
数据分析任务都是分类,都需要构造一个模型或分类器来预测类标号。
销售经理希望预测给定的顾客将花多少钱。该数据分析任务就是数值预测,其中构造的模型预测一个连续值函数或有
序值,而不是类标号。这种模型是预测器。回归分析是数值预测最常用的统计学方法。(当然还存在其他数值预测方法)。
分类和数值预测是预测问题的两种重要类型。本文主要讲述分类。