写作目的:作为自己学习ML的记录,也希望能为后来者提供一点点参考
文章内容:本篇主要总结、回顾一下机器学习课程第三周的内容
目录
1、回归(Regression)问题与分类(Classification)问题
6、多分类问题(Multiclass Classification: One-vs-all)
7、欠拟合(underfitting)和过拟合(overfitting)
课程内容
主要内容回顾
1、回归(Regression)问题与分类(Classification)问题
官方定义:In a regression problem, we are trying to predict results within a continuous output, meaning that we are trying to map input variables to some continuous function. In a classification problem, we are instead trying to predict results in a discrete output. In other words, we are trying to map input variables into discrete categories.
通俗点说:
回归问题的结果是无限多个值中的具体的一个
分类问题的结果是归类到某少数几个值中的一个
2、分类问题的假设函数表达式
相较于前面学习到的线性回归问题的假设函数h,因为分类问题的结果表现为归类(映射)到某个值的概率,所以它的结果总是在[0,1]这个范围内,由此先行者们给出公式:
说明:e为数学常数,z = theta的转置乘以X,其实就相当于前面线性回归中的假设函数,上面图片中的h(x)指的是分类问题的假设函数,和前面线性回归的假设函数名字一样,但是表达式有区别,需要注意
特性: P(y=0|x;θ)+P(y=1|x;θ)=1
即:根据某一具体特征值预测结果为0的概率加上预测结果为1的概率的和总是等于1
3、决定边界(Decision Boundary)
下图为官方课程给出的推导过程
说明:先行者们已经确定了假设函数公式,在这个前提下,