![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
应用预测建模习题个人练习
totobey
这个作者很懒,什么都没留下…
展开
-
应用预测建模第六章线性回归习题6.3【缺失值插补,分层抽样,预测变量重要性,重要预测变量如何影响响应变量,多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网】
模型:多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网语言:R语言参考书:应用预测建模 Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译本案例中的一些模型概念与数据分析思路不做详细解释,因为在之前的博文中已经写过了,是类似的,可以参考同章节的博文。案例:导入...原创 2019-12-05 12:06:11 · 1410 阅读 · 0 评论 -
应用预测建模第六章线性回归习题6.2【模型的最优参数选择与模型对比 ,多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网】
模型:多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网语言:R语言参考书:应用预测建模 Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译案例#载入数据library(AppliedPredictiveModeling)data(permeability)he...原创 2019-12-03 21:32:01 · 1805 阅读 · 0 评论 -
应用预测建模第六章线性回归习题6.1【主成分分析,模型的最优参数选择与模型对比 ,多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网】
模型:多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网语言:R语言参考书:应用预测建模 Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译案例:( b)在本例中预测变量是各个频率下吸收量的一个测量。由于频率处在一个系统的顺序中( 850 ~1050 nm),因此预测...原创 2019-12-03 13:28:33 · 1857 阅读 · 0 评论 -
应用预测建模第六章-线性回归-预测化合物溶解度练习-R语言(多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网)
模型:多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网语言:R语言参考书:应用预测建模 Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译案例:导入数据集。library(AppliedPredictiveModeling)data(solubilit...原创 2019-11-28 20:50:54 · 4218 阅读 · 0 评论 -
应用预测建模第四章过度拟合与模型调优习题4.4【分层随机抽样、小样本的模型评估方案】
《应用预测建模》Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译第四章 过度拟合与模型调优4.4Brodnjak-Vonina 等( 2005 )提出了一种在食品科学研究中检测样本油脂类别的方法。在此方法中,他们使用气象色谱仪(一个能够分离样本化学物质的仪器)测量了油脂中7 种不同的脂肪酸。这些测量...原创 2019-11-25 01:48:52 · 698 阅读 · 0 评论 -
应用预测建模第四章过度拟合与模型调优习题4.3【运用一倍标准差法、容忍度选择简洁模型】
《应用预测建模》Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译第四章 过度拟合与模型调优4.3 偏最小二乘法( 6. 3 节)可以对1. 4 节中化工生产过程的产量进行建模。相关数据包含在AppliedPredictiveModeling软件包中,载入入数据的代码如下:> library(A...原创 2019-11-25 00:10:41 · 719 阅读 · 0 评论 -
应用预测建模第四章过度拟合与模型调优习题4.1 4.2【不同样本量与建模目的的测试集与训练集划分】
《应用预测建模》Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译第四章 过度拟合与模型调优4. I .考虑1.1 中描述过的音乐流派数据。在这个例子里,建模的目的是用预测变量将音乐样本划分到相应的音乐流派中,( a )你打算用什么方法分割数据?解释其原因。( b )用本章介绍的工具,给出能实现该方...原创 2019-11-24 19:20:40 · 1102 阅读 · 0 评论 -
应用预测建模第四章信用卡评分模型练习-R语言【不同的重抽样方法比较:重复K折交叉验证、K折交叉验证、留一交叉验证、重复训练/测试集划分 、Bootstrap;支持向量机与逻辑回归模型比较】
不同的重抽样方法比较:重复K折交叉验证、K交叉验证、LOOCV留一交叉验证、重复训练/测试集划分 (留多交叉验证、蒙特卡洛交叉验证)、Bootstrap自助法、632法(为消除估计偏差,Bootstrap自助法改进)支持向量机与逻辑回归模型比较应用预测建模 Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟...原创 2019-11-24 17:43:53 · 2119 阅读 · 5 评论 -
应用预测建模第三章数据预处理习题3.3【退化分布、降低变量强相关性】
《应用预测建模》Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译第三章 数据预处理3. 3 本书第5 章会介绍定量构效关系( QSAR )模型。该模型用化合物的特征去预测其他的化学性质。caret 包中有一个来自Mente 和Lombardo (2005 )的数据集。数据包含对208 种化合物渗透血脑...原创 2019-11-24 02:29:55 · 1191 阅读 · 0 评论 -
应用预测建模第三章数据预处理习题3.2【退化分布、缺失值的缺失模式探索、处理缺失值】
《应用预测建模》Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译第三章 数据预处理3. 2 UC机器学习数据库里还有一组大豆数据。数据收集自683 个大豆样本,其目的是用来预测大豆疾病。35 个预测变量大部分是分类变量,包括环境条件的信息(如温度和降水量)和种植条件(如霉菌生长)。结果变量是19 个不...原创 2019-11-24 00:47:32 · 1076 阅读 · 0 评论 -
应用预测建模第三章数据预处理习题3.1【预测变量分布、变量关系、离群点、偏度、box-cox变换】
《应用预测建模》Applied Predictive Modeling (2013) by Max Kuhn and Kjell Johnson,林荟等译第三章 数据预处理3. 1 UCI 机器学习数据库中有一个关于玻璃鉴定的数据。数据自214 个玻璃样本组成,分别被标记为7 个分类中的1 个。有9个预测变量,包括折射率和八种化学元素的百分比: Na, Mg, Al. Si, K,Ca, ...原创 2019-11-23 21:32:21 · 1059 阅读 · 0 评论