自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

连峰碧波间,浅水泛舟游

运交华盖欲何求,未敢翻身已碰头。破帽遮颜过闹市,漏船载酒泛中流。横眉冷对千夫指,俯首甘为孺子牛。躲进小楼成一统,管他冬夏与春秋。

  • 博客(3)
  • 资源 (4)
  • 收藏
  • 关注

原创 数据挖掘笔试题

1.过拟合和欠拟合的原因有哪些,如何避免? 过拟合:模型过于复杂,模型参数过多,决策树中的分支过多,神经网络中的神经元过多 欠拟合:模型过于简单(模型参数过少,。。 在最小化模型误差的同时,对参数进行惩罚,也就是正则化方法,调整模型复杂度,使得模型泛化误差达到最小。决策树中对树进行剪枝,控制叶节点的个数 2.决策树中父节点和子节点之间的信息熵大小关系,原因 原因就是信息增益是大于零的,信息

2015-08-25 17:38:52 1192

原创 序列模型

2.中级篇\Large\textbf{2.中级篇} 1.非二元变量\textbf{1.非二元变量} \quad\quad在基础篇中我们处理的是购物篮数据,一个事务中是否包含某个项。如果我们面对的数据是,每个事务中都会包含大多数项,但是重要的区别是一个事务中包含某个项的多少是不同的,换句话说,如果我们将项看成是变量(属性),购物篮数据处理的是二元变量,而有可能我们需要处理的是分类变量,甚至是连续型

2015-08-25 15:45:46 482

原创 关联分析(从基础到高级)

关联规则

2015-08-12 15:50:58 2470

[N._N._R._Ranga_Suri,_Narasimha_Murty_M,_G._Athith(z-lib.org).pdf

异常检测必读图书,outlier detection: techniques and applications

2019-07-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除