Softmax回归其实就是分类问题
对于分类,涉及到“硬性”类别和“软性”类别,“硬性”指我们只关心它属于哪个类别,“软性”指我们想要得到它属于每个类别的概率。软性和硬性之间很模糊,因为即使我们只关心“硬性”类别,我们使用的依旧是“软性”类别的模型。
一、一位有效编码(One-Hot)
1.定义:采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效
2.举例与必要性说明:
假设我们有一群学生,他们可以通过三个特征来形容,分别是:
- 性别:[“男”,“女”]
- 年级:[“初一”,“初二”,“初三”]
- 学校:[“一中”,“二中”,“三中”,“四中”]
举个例子,用上述四个特征来描述小明同学,即“男生,初一,来自二中”,如果特征类别是有序的话,我们能够用表示顺序的数组表示
即“男生,初一,来自二中” ==> [0,0,1]
但是这样的特征处理并不能直接放入机器学习算法中,因为类别之间是无序的。
将这些数据用单独的数字来表示,执行的效率会高很多