- 博客(3)
- 资源 (4)
- 收藏
- 关注
原创 数据挖掘笔试题
1.过拟合和欠拟合的原因有哪些,如何避免? 过拟合:模型过于复杂,模型参数过多,决策树中的分支过多,神经网络中的神经元过多 欠拟合:模型过于简单(模型参数过少,。。 在最小化模型误差的同时,对参数进行惩罚,也就是正则化方法,调整模型复杂度,使得模型泛化误差达到最小。决策树中对树进行剪枝,控制叶节点的个数 2.决策树中父节点和子节点之间的信息熵大小关系,原因 原因就是信息增益是大于零的,信息
2015-08-25 17:38:52 1192
原创 序列模型
2.中级篇\Large\textbf{2.中级篇} 1.非二元变量\textbf{1.非二元变量} \quad\quad在基础篇中我们处理的是购物篮数据,一个事务中是否包含某个项。如果我们面对的数据是,每个事务中都会包含大多数项,但是重要的区别是一个事务中包含某个项的多少是不同的,换句话说,如果我们将项看成是变量(属性),购物篮数据处理的是二元变量,而有可能我们需要处理的是分类变量,甚至是连续型
2015-08-25 15:45:46 482
[N._N._R._Ranga_Suri,_Narasimha_Murty_M,_G._Athith(z-lib.org).pdf
2019-07-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人