目录
Q1:回归问题阐述:
举例:若去银行贷款,需要提供的信息为个人年龄:与个人月收入,则银行给出可贷款的额度y。
分析:特征:工资、年龄
标签:额度
参数:工资与年龄对额度的影响程度
目的:找到一条线(或一个平面)更好的拟合数据集
公式表达:
推广:
Q2: 误差项定义:
误差项定义: 公式1
Q3: 独立同分布的意义:
- 误差服从独立同分布的,且服从均值为0,方差为的高斯分布
- 独立:张三与李四去贷款
- 同分布:他们在同一家银行中贷款
- 高斯分布:银行可能会给的多或者给的少,总体保持稳定。但绝大多数情况下,浮动不大,极少数情况浮动大,符合正常情况
- 高斯分布公式:
误差服从高斯分布: 公式二
因为最终目标是求,所以将公式一带入公式二中:
Q4:似然函数作用
概率论:独立同分布 联合概率密度等于各自边缘分布的乘积
总结:已知结果,求参数的方法——似然函数
似然函数:
因为乘法难以求解,加法容易,故将引入——对数似然函数(极值虽然发生变化,但极值点不会变)
对数似然函数:
因似然函数需求最大,故对数似然函数也应求最大。
即求代价函数最小(损失函数): (最小二乘法)
Q5: 参数求解
当A为对称矩阵时,结果为2Ax
Q6: 梯度下降法
- 按照梯度的反方向下坡
- 最小二乘法这种直接求解的方法,用处太局限,故绝大多数使用优化算法;eg:梯度下降法