交叉检验
交叉检验是一种数据集的分割方式,他将数据集分为n份,拿一份做测试集,其他的做训练集
交叉检验原理
如上图,他将数据集划分为cv=4也就是4份
第一次将第一份数据做验证集,其他作为训练。
第二次将第二份数据做验证集,其他作为训练。
··········
交叉检验是一种划分数据集的方法,目的是为了得到更加准确的模型评分
网格搜索
模型有很多超参数,其能力也存在很大的差异。需要手动产生很多超参数组合,来训练模型,每组超参数都采用交叉验证评估,最后选出最优参数组合建立模型.
网络模型+交叉验证=无敌
利用上述内容➕前几天所学,试做一个项目:预测乳腺癌的良性或恶性
题目: 预测乳腺癌的良性或恶性
要求: 使用乳腺癌数据集中的临床特征,构建一个机器学习模型,预测肿瘤是良性还是恶性。
评估标准: 模型准确率(Accuracy)
我的解答:
运行代码的后得到结果为