引例:
数据:工资和年龄(2个特征)
目标:预测银行会贷款给我多少钱(标签)
考虑:工资和年龄都会影响最终银行的结果,那么它们各自有多大的影响呢?(参数)
回归:通过你的数据最终预测出一个值
(分类:最终的到的是一个类别。比如说银行借还是不借你贷款)
===》对于2维数据,就是找到一条最好的线对数据进行拟合
假设1是年龄的参数,2是工资的参数
拟合的平面:h(x)=0+1x1+2x2 (0是偏置项)
整合:h(x)=
误差:真实值和预测值之间肯定是要存在差异的(用ε来表示该误差)
对于每个样本: =+ε(i)
误差ε(i)是独立并具有相同分布,并且服从均值为0方法为 的高斯分布
独立:张三和李四一起来贷款,他俩没关系 (算法对待每一个数据都一样,没什么区别)
同分布:他俩都来的是我们假定的这家银行
高斯分布:银行可能会给多,也可能会给少,但是绝大多数情况下这个浮动不会太大,极小情况下浮动会比较大,符合正常情况。
似然函数:由数据去推参数