自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (2)
  • 收藏
  • 关注

原创 机器学习算法——支持向量机

支持向量机(SVM,support vectors machine)的算法原理比较简单,就是寻找最大间隔讲两个类别分开,从数学上推可能复杂点。按照样本的情况一下三种:①当训练样本线性可分时,通过硬间隔最大化——线性可分支持向量机;②当训练样本近似线性可分时,通过软间隔最大化——线性支持向量机;③当训练样本线性不可分时,通过核技巧和软间隔最大化——非线性支持向量机;首先从线性可分支持...

2018-08-31 18:00:24 686

原创 机器学习算法——集成算法(一)

集成算法(Emseble Learning)是构建多个学习器,然后通过一定策略结合把它们来完成学习任务的,常常可以获得比单一学习显著优越的学习器。周志华的书上说,“个体学习器的"准确性"和"多样性"本身就存在冲突,一般准确性很高之后,要增加多样性就需牺牲准确性。事实上,如何产生并结合‘好而不同’的个体学习器,恰是集成学习研究的核心”(对准确性和多样性的论述还不是很理解)。按照个体学习器之间的关...

2018-08-27 19:26:52 11926 1

原创 机器学习算法——决策树

决策树(Decession Tree) 算法用处很多,而且还是一些集成算法的基础。它的基本原理是:选取某个特征属性,按照特征值来讲最初的样本集分开成两个节点,对分开的节点再选取特征进行划分生成新的节点,一直递归地划分下去直到满足一定条件为止(全部叶子节点中都是一类,或者树的层数、宽度达到一定数值)。这个过程有点像有一堆混在一起的豆子,我们手上有几种筛子,通过几次筛选后讲不通的豆子分开,这个“筛子”...

2018-08-25 01:14:18 553

原创 机器学习算法——K近邻

KNN(K-Nearest Neighbor,K近邻)算法作为一种分类算法,它的实现原理比较简单:1.指定K值;2.计算当前点与样本点中的距离,并按从小到大顺序排列;3.在距离最小的前K个点中,统计样本的标签数量,将当前点分类到同类最多的类别里面去(也就是少数服从多数的原则)。                                                           ...

2018-08-23 20:27:58 638

原创 机器学习算法——聚类

聚类属于无监督学习,事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类是不需要对数据进行训练和学习的。主要的聚类算法有K-Means和DBSCAN。K-Means算法的基本原理比较简单:1.指定K值(数据要分成的簇的数目),并指定初始的k个质心;2.遍历每个数据点,计算其到各个质心的距离,将其归类到距离最近的质心点;3分类完毕后,求各个簇的质心,得到新的质心点;4.重复2和3中的...

2018-08-23 14:50:44 886

原创 机器学习总结(四)——最优化方法

机器学习中所谓的训练其实就是损失函数的优化过程,求损失函数的最优化解,主要是得靠一些常规套路,去一点一点地接近最优化目标。常用的有梯度下降法、牛顿法和拟牛顿法、共轭梯度法、启发式优化方法、拉格朗日乘数法等。一、梯度下降法(Gradient Descent)       梯度下降法实现的原理简单,是最常用最简单的最优化方法。当目标函数是凸函数时(如线性规划),得到的是全局最优解。但是在一...

2018-08-21 21:57:19 1886

原创 机器学习总结(三)——损失函数

经典机器学习算法,他们最本质的区别是分类思想(预测y的表达式)不同,有的是基于概率模型,有的是动态规划,表象的区别就是最后的损失函数不同。损失函数分为经验风险损失函数和结构风险损失函数,经验风险损失函数反映的是预测结果和实际结果之间的差别,结构风险损失函数则是经验风险损失函数加上正则项(L0、L1(Lasso)、L2(Ridge))。不同的算法常用的损失函数(Loss Function)有...

2018-08-21 19:59:33 52632

原创 机器学习总结(二)——主要过程和名词

讲述机器学习算法的主要过程,以及涉及的一些名词。1、物理意义,学习不太算法时需要了解其基于什么样的物理过程,比如逻辑回归是将样本的特征通过函数映射为一个(0,1)之间的数字,如果大于决策边界(如0.5)则判定为标签1,小于则判定为0。物理意义其实相当于模型的定义,或者建立模型建立的过程。2、决策边界,分类算法是为了把样本分开,然后通过边界(也就相当于分类器或者模型)来判断未知样本的类别,比...

2018-08-20 19:03:04 364

原创 机器学习总结(一)——主要算法

自学了一段时间的机器学习后来写写自己的一些理解,首先理一下各种学习方法,以及它们的分类。机器学习的主要算法分为:一、监督学习(指样本带有标签,知道每个样本分属哪个类别):       主要包括分类和回归,但是很多方法其实可以用于分类,也可以用于回归,如决策树(DT)等。分类—— 1、逻辑回归(Logister Regression);                       ...

2018-08-19 19:35:58 782

计算机考研408真题带解析09-17

计算机考研408统考真题 2009-2017九年真题 附带解析

2018-06-25

计算机408考研 考纲2018

2018年教育部考研大纲 数据结构+计算机组成+计算机网络+操作系统

2018-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除