第三周 逻辑回归与正则化
学完前三周简要做个总结,梳理下知识框架:
第一讲 逻辑回归Logistic Regression
1.分类问题Classification Problem
for example
->Email: Spam / Not Spam 判断一封邮件是不是垃圾邮件?
->Online Transaction:Fraudulent(Yes/NO)?判断某个网络交易是否是诈骗?
->Tumor:Malignant / Benign?判断肿瘤是恶性还是良性?
综上,分类问题就是这样一类问题:针对某个实际样本,根据某种标准,判断它属于哪一个类别,其最终结果是离散的输出值。
分类问题在生活中很常见,除了以上的例子外,想对某水体采样判断水质的酸碱性、对某地大气采样判断其空气污染级别,以上问题的解决都属于今天我们讨论的话题。
2.名次解释
对于分类classification问题,要构建逻辑回归模型去预测,注意:这里的逻辑回归虽然也有‘回归’二字,但并不是针对回归问题而言,因为其预测的结果是离散值,所以不要被“回归”二字混淆,逻辑回归并不属于回归问题。
3.假设函数Hypothesis
分类问题要求Classification: y = 0 or 1
相应地预测结果 h(x) need to be limited to : 0 <= h(x) <= 1
所以,对于逻辑回归中的假设函数我们有如下定义(在线性回归模型上进行改进):
当样本预测结果h(x)>=0.5时,预测输出值y=1;若h(x)<0.5时,预测输出值y = 0;
所以这使得假设函数h(x)有这样的物理意义:h(x)表征预测结果y=1的概率;