自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

seeker的博客

关注机器学习、数据挖掘、AutoML、大数据

  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 统计学习方法 第五章

统计学习第五章:决策树决策树模型 分类决策树模型是一种描述对实例进行分类的树形结构,表示基于特征对实例进行分类的过程。决策树由结点和有向边组成。结点有两种类型:内部节点和叶节点,内部节点表示一个特征或属性,叶节点表示一个具体的类。 分类的时候,先从根节点开始,当前节点设为根节点,当前节点必定是一种特征,根据实例的在该特征上的取值,向下一层的节点移动,直到到达叶节点,将实例分到叶节点对应的类中。

2017-02-27 00:08:38 670

原创 统计学习方法第四章

统计学习方法第四章:朴素贝叶斯法朴素贝叶斯法   朴素贝叶斯法基于特征条件独立假设学习到给定数据集的联合概率分布P(X,Y),具体地是通过学习先验概率分布及条件概率分布,两个概率相乘即得联合概率分布。先验概率是在缺乏某个事实的条件下描述某个变量,个人理解在机器学习中,我们要求出测试样例属于某一个类别的概率,那么先验概率就是不考虑任何因素每个类别出现的概率(P(Y=Ck)),这种情况下应该将样本归

2017-02-26 14:23:17 633

原创 最短排序子数组

链接:https://www.nowcoder.com/courses/1/2/19 来源:牛客网对于一个数组,请设计一个高效算法计算需要排序的最短子数组的长度。 给定一个int数组A和数组的大小n,请返回一个二元组,代表所求序列的长度。(原序列位置从0开始标号,若原序列有序,返回0)。保证A中元素均为正整数。 测试样例: [1,4,6,5,9,10],6 返回:2这道题最优解时间复杂度是

2017-02-25 00:50:51 341

原创 统计学习方法第三章

统计学习方法第三章:K近邻K近邻法和其他的机器学习方法不太一样,因为它没有显示的学习的过程,可以理解为没有训练的过程。K近邻思想:给定一个训练集,当对新的测试样本分类时,分别计算测试样本和训练集中每个样本的距离即相似度,从中选择前K个最相似的样本,然后从这K个最相似样本中,选择出现次数最多的类别作为测试样本的类别。可见K近邻法的好坏与三个因素有关:如何度量样本相似度(距离度量)?K值如何选取(K

2017-02-24 23:13:08 2149

原创 统计学习方法-第二章

第二章:感知机算法感知机是二分类的线性模型,输入实例的特征向量,输出实例的±类别。模型表达如下: w·x表示向量w和x的内积。sign是一个映射函数,由线性变换到输出空间(+1,-1)的一个映射。这个映射函数是 ,当w*x+b>=0,y=+1,否则y取-1.感知机的学习策略 如果给定一个数据集,如果存在某个超平面S:w·x+b=0,能够将数据集中的正样本点和负样本点全部分开,及全部正确划

2017-02-24 01:55:40 867

原创 统计学习方法 第一章

统计学习方法 第一章经验风险最小化: 模型在训练集上的损失最小的一种策略,当数据集合较大时,会使模型在训练集上表现良好,但是容易造成过拟合,即在测试集合上表现欠佳。结构风险最小化: 结构风险最小化是防止过拟合的一种策略,是在结构风险最小化的基础上加上表示模型复杂度的正则化项或者惩罚项。所谓表示模型复杂度的正则化项,模型复杂度是一个函数,具体可以是模型参数向量的范数或者其它形式,然后再乘以一个

2017-02-20 23:56:37 335

《maven实战》高清版

maven实战高清版,比较适合初学者,详细讲解了maven的版本控制机制,可操作性高。

2016-07-18

《机器学习实战》源代码

机器学习实战原书的代码及数据资源,亲测可运行。

2016-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除