1 分类问题
输出变量为有限个离散变量的预测问题; 输出空间非度量空间,定性评判错误与否;
如:一颗肿瘤是良性还是恶性的,金融交易是否是欺诈
以二元分类为例:
设因变量可能属于的两个类为0-负向类,1-正向类,表达为
因分类问题解在有限区间,因线性回归结果区间使用线性回归做预测显然是不合适的,如图肿瘤预测的例子,当预测值在0-1之 间,取0.5为阈值, 结果是较为符合样本数据的,但当我们观测到一个体积较大的肿瘤,更新线性回归线,阈值更新,则结果会 与样本数据存在较大误差;
通常选取逻辑回归算法为分类算法使用,它的结果会散布在0-1之间,适用于因变量为离散值的情况;
2 模型假说
逻辑回归 假设:
g即逻辑函数,其函数图如下,输出变量永远在0和1之间:
公式代表,当参数θ确认,对于给定的输入变量x,输出 变量y为1(正向类)的概率;
3 边界理解
观察逻辑函数 函数图
当z=0时ÿ