机器学习第三课
作业内容
- 模型、算法和策略分别是什么
- 线性回归中,策略具体是指什么策略?算法具体指哪几种算法?模型具体指哪种函数空间?
- 请根据波士顿房价数据,使用sklearn做一个线性回归(提示:注意数据规整和预处理,以及测试集和验证集的划分,还要注意正则化项的选择,并尝试调试超参数)
- 学习一下mysql的基础命令,将sql文件倒入数据库中
- 使用python和pandas链接数据库,调取刚刚导入的sql文件
- 对刚刚调取的sql数据,做一些你想做的数据分析或者数据挖掘工作(比如每篇文章有多少字)
代码和解析
第一题
模型就是所要学习的联合概率分布、条件概率分布或者决策函数
策略就是从模型的假设空间中选取最优模型的方法
算法就是指模型的具体计算方法,即如何求解最优模型
第二题
线性回归中的模型、策略和算法:
- 模型是指线性函数空间
- 策略是经验风险损失函数——MSE、MAE
- 算法是求解析解;梯度下降法
MSE和MAE的区别
MSE(Mean Square Error)均方误差。
通过平方的形式便于求导,所以常被用作线性回归的损失函数。
M S E = 1 m ∑ i = 1 m ( y i − y i ^ ) 2 MSE=\frac{1}{m}\sum_{i=1}^m(y_{i}-\hat{y_{i}})^{2} MSE=m1i=1∑m(yi−yi^)