ISL第三章习题

最新推荐文章于 2022-03-20 17:20:30 发布

CV_William

最新推荐文章于 2022-03-20 17:20:30 发布

阅读量819

点赞数 5

分类专栏：机器学习人工智能 R语言文章标签： python 机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41194171/article/details/91852441

版权

机器学习同时被 3 个专栏收录

13 篇文章 2 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1.描表3-4中的p值所对应的零假设。说明基于这些p值可得出什么结论。请用sales，TV，radio和newspaper等变量描述结论，而不仅仅给出线性模型的系数。

（1）原表如下：主要看p值

在这里插入图片描述

（2）零假设概念：

在这里插入图片描述

答：零假设是指TV，radio和newspaper三种形式的广告对销量没有关联。

在这里插入图片描述

答：
TV和radio的 P值小（p<0.0001） ，拒绝原假设，所以TV和radio对销量 有关联 。

newspaper的 P值大(p=0.8599） ，接受原假设，newspaper对TV的销量 没有关联 。

（3）y真实值与yhat预测值相减得出残差：

在这里插入图片描述

（4）结论：

在这里插入图片描述

零假设是指TV，radio和newspaper三种形式的广告对销量没有关联。

TV和radio的 P值小（p<0.0001），拒绝原假设，所以TV和radio对销量有关联。

newspaper的 P值大(p=0.8599，接受原假设，newspaper对TV的销量没有关联。

在这里插入图片描述

（3）K值得选择：

对于k值的选择，没有一个固定的经验，一般根据样本的分布，选择一个较小的值，可以通过<font color=red size=>交叉验证选择一个合适的k值。

选择较小的k值，就相当于用较小的领域中的训练实例进行预测，训练误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是泛化误差会增大，换句话说，K值的减小就意味着整体模型变得复杂，容易发生 过拟合
选择较大的k值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少泛化误差，但缺点是训练误差会增大。这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单，可能 欠拟合。
一个极端是k等于样本数m，则完全没有分类，此时无论输入实例是什么，都只是简单的预测它属于在训练实例中最多的类，模型过于简单。

（4）结论：

对于<font color=red size=>分类问题:输入和输出是数据的类别。对于新来的数据点，根据其k个最近邻的训练数据的类别，<font color=red size=>通过多数表决等方式进行预测。

对于<font color=red size=>回归问题:输入和输出是数据的值。对于新来的数据点，<font color=red size=>取其k个最近邻的训练数据的平均值为预测值。

参考资料：
R统计学习导论

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
ISL第三章习题

1.描表3-4中的p值所对应的零假设。说明基于这些p值可得出什么结论。请用sales，TV，radio和newspaper等变量描述结论，而不仅仅给出线性模型的系数。（1）原表如下：主要看p值![avatar](/Users/wanghuiyong/Desktop/第三章习题/第二章习题图片/屏幕快照 2019-06-13 上午12.12.27.png)（2）零假设概念：![ava...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。