2019年3月7日,学习内容:
1)什么是线性模型:变量与变量之间的关系能够用一次模型来表示(举例:y=C+ax+by+cz+....),则此为线性模型,需要注意的是直线是特殊的线性模型(因为只有两个变量时,并且这两个变量是一元一次方程的关系,则是直线),以前一直以为线性回归模型就是直线模型,这是错误认识。
2)当使用线性回归模型时,代价函数是残差平方和,当残差平方和最小时求得的参数才是最合适的,但为什么残差平方和作为代价函数时比较合适呢:这是根据极大似然函数求最大值时而推导出来的:
说明几个概念(部分参考百度百科 https://baike.baidu.com/item/%E4%BC%BC%E7%84%B6%E5%87%BD%E6%95%B0/6011241?fr=aladdin):
2.1)概率描述了已知参数时的随机变量的输出结果;似然则用来描述已知随机变量及输出结果时,未知参数的可能取值。
2.2)已知抛硬币出现正面的概率为0.5,我们可以问硬币落地时十次都是正面向上的“概率”是多少;如果我们不知道抛一次硬币出现正面的可能性是多大,我们一共做了n次试验,在这n次中,有2/n次出现了正面。那么我们可以说,这枚硬币正反面对称的“似然”程度是多大。通过某个函数去衡量这种程度的函数就是