数据挖掘
文章平均质量分 77
zhlei12345
这个作者很懒,什么都没留下…
展开
-
数据挖掘笔试题
1.过拟合和欠拟合的原因有哪些,如何避免? 过拟合:模型过于复杂,模型参数过多,决策树中的分支过多,神经网络中的神经元过多 欠拟合:模型过于简单(模型参数过少,。。 在最小化模型误差的同时,对参数进行惩罚,也就是正则化方法,调整模型复杂度,使得模型泛化误差达到最小。决策树中对树进行剪枝,控制叶节点的个数 2.决策树中父节点和子节点之间的信息熵大小关系,原因 原因就是信息增益是大于零的,信息原创 2015-08-25 17:38:52 · 1192 阅读 · 0 评论 -
模型过度拟合
这几天在训练一个文本处理的机器学习算法,使用支持向量机和决策树算法在训练集上的数据的准确度特别高,但是在测试集上的数据的准确度确很低,于是陷入过度拟合的烦恼中,查找资料发现一些多度拟合的看法。仔细想想确实在训练时存在一些问题,第一:输入变量多,由于缺乏对问题的根本认识,使用了很多无关变量,这个问题打算从其它途径先认识变量和问题的关系;第二:数据的噪声可能是比较大,没有考虑到关键的特征和信息。下面的几转载 2015-09-03 15:14:17 · 1689 阅读 · 0 评论