以下问题主要针对二分类,并由二分类问题引出逻辑回归
1,
分类问题,输入特征得到某一类,以上显示用回归思想解决分类问题,就是将某一类与数字对应,如1类对应数字1,训练的结果如果接近1,就划分为1类.
但是这样做,最大的问题是回归的评判标准不适合于回归问题.
如上图,以y=0作为阈值,那么会由于一些点的error较大,造成阈值的改变,不利于分类问题.说到底,这种方法找到一条直线作为阈值,分割为两类点.但是求阈值还是要用到损失函数.并且对于多分类问题很麻烦.
2,分类问题
这里需要注意的是,损失函数的变化.变为不等于y的相加
抽象得到
这里需要知道:取出x,那么这个x来自c1的几率是多少.
需要先知道,从c1,c2中取球的概率和c1,c2中取出x的概率.
放在分类问题中,如果判断一篇文章属于什么类型,就需要知道.
每个类型的文章所占的比例,如科技1/4,娱乐3/4,以及在科技类出现该文章特征的概率,如飞船出现在科技文章中的概率为9/10.
上图中求出先验概率
要预测一只宝可梦属于水系的概率还需要知道:所有水系宝可梦中挑出该宝可梦的概率.初次一看,由于不