原文连接:http://www.techweb.com.cn/network/system/2016-01-27/2269274.shtml
此文仅是一个小品文,详细理论请读论文,参考书籍。
前言:我的概述
机器学习面对的是一个受限有穷空间 到 一个扩大的有穷空间 的泛化问题。若假设空间足以覆盖真实的数据空间,机器学习方法可以弃之不用,专家的人工归纳可以覆盖所有的规则时,基于规则的判定系统是准确无疑的。
对于一个不能充分描述的真实数据空间,假设空间的可信度就大打折扣,基于假设空间建立的模型就一直在欠拟合和过拟合之间摇摆。
下面总结的几个方法可以从直观上解决一些基本问题,并能体现立竿见影的效果。
导语
提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改善。你会觉得无助和困顿,这是 90% 的数据科学家开始放弃的时候。
不过,这才是考验真本领的时候!这也是普通的数据科学家跟大师级数据科学家的差距所在。你是否曾经梦想过成为大师级的数据科学家呢?
如果是的话,你需要这 8 个经过证实的方法来重构你的模型。建立预测模型的方法不止一种。这里没有金科玉律。但是,如果你遵循我的方法(见下文),(在提供的数据足以用来做预测的前提下)你的模型会拥有较高的准确率。
我从实践中学习了到这些方法。相对于理