R语言biopsy 数据集数据分析 报告
交叉验证的目的是为了提高模型在测试集上的预测准确率,以及尽可能避免过拟合。变量2的铰链函数作用就是:在0和变量2减去5.5的结果中,比较最大值。通过前向过程建模,然后后向过程精简模型,以防止过拟合,并去除铰链。大于3,则用0.2152乘以铰链函数的值,否则乘以-0.5961。只要变量2的值大于5.5, 铰链函数的值就会乘以系数,否则为0。特征变量都是数字,而结果变量是因子,因此不需要数据结构转换。其他未出现的变量,包括含有铰链的变量,其系数都是0。对于乘法模型,其中有交互项,惩罚系数为3。
复制链接