自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 聚类(无监督学习方法)

聚类是将数据点归到多个簇当中,并将相同的数据点出于同一个簇,而不相似的数据点处于不同的簇聚类性能度量(看聚类结果有无参考模型)大致有两类:“内部指标”和“外部指标”内部指标有:Jaccard系数、FM指数、Rand指数(值在[0,1]内,越大越好)外部指标有:DB指数(越小越好)、Dunn指数(越大越好)距离计算需要满足:非负性、同一性、对称性、直递性(三角不等式)最常用的是...

2019-03-08 16:57:59 1154

原创 关联分析(无监督的学习方法)

关联分析及其有关概念的介绍关联分析:通过频繁项集或者关联规则来发现大数据集中元素之间有趣关系的一个工具集。关联分析的目标就是发现频繁项集和关联规则。频繁项集:经常出现在一起的元素集合。项集的支持度:数据集中包含该项集的记录所在的比例。关联规则:暗示两元素之间可能存在很强的关系。关联规则的可信度或者置信度:例如{尿布} -> {葡萄酒}这条关联规则的可信度被定义为“支持度({尿布,...

2019-03-08 15:28:55 1253

原创 集成算法(bagging、boosting、随机森林)

集成方法是将不同的分类器组合起来,可以是不同算法的集成、同一算法在不同设置下的集成、数据集不同部分分配给不同分类器之后的集成。这里将介绍三种集成方法:bagging、randomforest和boosting。

2019-03-07 15:45:05 420

原创 Vim查找、删除、复制

查找并删除按ESC键回到普通模式;输入/加想要查找的字符,回车;按N,n可以向上向下查找,按x可以进行删除,按a可以进入编辑模式。普通模式下删除文本的快捷方式命令说明x/Delete删除光标所在字符X删除光标所在的前一个字符dd删除整行dG删除到文档结尾处d1G删除到文档首部:2,4d删除第2行到第4行复制:将第9行...

2019-03-02 11:12:27 752

原创 决策树的原理

决策树的原理:根据树结构进行决策,可以用于分类和回归。一颗决策树包括一个根结点、若干个内部节点和若干个叶节点。从根节点出发,对每个特征划分数据集并计算信息增益(或者增益率,基尼系数),选择信息增益最大的特征作为划分特征,依次递归,直至特征划分时信息增益很小或无特征可划分,形成决策树。决策树优点1. 计算复杂度不高; 2. 输出结果易于理解; 3. 不需要数据预处理; 4...

2019-03-02 11:11:39 3203

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除