机器学习
文章平均质量分 68
hellowuxia
这个作者很懒,什么都没留下…
展开
-
支持向量机(上)
1.简介在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。其原理从线性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(Support Vector Machine,简称SVM)。SVM的主要思想可以概括为两点: 1)它是针对线性可分情况进行分析,对于线性不可原创 2017-03-19 12:27:10 · 800 阅读 · 0 评论 -
线性回归
线性回归(Linear Regression)https://baike.baidu.com/item/%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92/8190345?fr=aladdin https://www.cnblogs.com/GuoJiaSheng/p/3928160.html一、介绍线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关原创 2017-11-24 22:11:54 · 1054 阅读 · 0 评论 -
集成学习
1.个体与集成集成学习通过构建并结合多个学习器来完成学习任务,有时也称多分类器学习、基于委员会的学习等。集成中只包含同种类型的个体学习器,这样的集成是同质的。同质集成中的个体学习器亦称“基学习器”,相应的学习算法称为“基学习算法”。集成中包含不同类型的个体学习器,这样的集成是“异质”的。异质集成中的个体学习器由不同的学习算法生成,这时就不再有基学习算法,相应的个体学习器常称为“组件学习器”或直接称为原创 2017-04-07 17:01:23 · 1533 阅读 · 0 评论 -
GSP算法
GSP算法(Generalized Sequential Pattern mining algorithm)https://wenku.baidu.com/view/19ee9abd960590c69ec376c6.html http://www.doc88.com/p-999957186220.html Mining Sequential Patterns: Generaliz原创 2017-11-15 21:35:58 · 6042 阅读 · 0 评论 -
KNN
KNN算法(K-NearestNeighbor)https://wenku.baidu.com/view/94aea4e8d15abe23482f4d5b.html https://baike.baidu.com/item/%E9%82%BB%E8%BF%91%E7%AE%97%E6%B3%95/1151153?fr=aladdin&fromid=3479559&fromtitle=knn1.介绍转载 2017-11-20 21:31:49 · 1299 阅读 · 0 评论 -
K-Means
一、简介:K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。二、基本思想:对于给定的类别数目K,首先给出初始划分,通过迭代改变样本和簇的隶属关系,使得每一次改进之后的划分方案都较前一次好。三、前提假设每一个簇都服从高斯分布且方差相同,均值做低度下降方差相同的混合高斯分布四、算法描原创 2017-11-13 22:25:29 · 489 阅读 · 0 评论 -
scikit-learn sklearn 0.18 官方文档中文版
scikit-learn sklearn 0.18 官方文档中文版http://blog.csdn.net/chinachenyyx/article/details/75299043转载 2017-11-13 21:27:21 · 1241 阅读 · 0 评论 -
CART(Classification And Regression Tree)
CART算法(Classification And Regression Tree)http://blog.csdn.net/u014568921/article/details/45082197 https://wenku.baidu.com/view/286c19dae009581b6bd9eb59.html http://www.dataguru.cn/article-4720-1.htm原创 2017-11-18 16:07:31 · 2920 阅读 · 0 评论 -
机器学习——模型评估与选择
1.拟合:接近目标的远近程度。 过拟合:学习能力过强导致过于拟合。过于学习学到认为女生必须是长头发。 欠拟合:学习能力低下导致欠拟合。学习能力低下,拥有长发的都是女生。2.评估方法: 目标:所选模型的泛化误差最小 一、留出法 Step 1: 将数据集D 互斥 的分成训练集S和测试集T,D=SUT。 Step 2:运行,得评估结果 多次循环Step1、Step2 最后,取多次重复实验原创 2017-02-27 16:34:29 · 577 阅读 · 0 评论 -
半监督学习
1.简介半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习:让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。主要分为半监督分类,半监督回归,半监督聚类和半监督降维算法。2.基本假设要利用未标记样本,必然要原创 2017-03-26 12:09:19 · 7147 阅读 · 0 评论 -
贝叶斯分类器(中)
EM算法翻译 2017-04-08 18:11:41 · 222 阅读 · 0 评论 -
贝叶斯分类器(上)
1.简介贝叶斯分类器的分类原理:通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。贝叶斯决策论(Bayesian decision theory)是概率框架下实施决策的基本方法。对分类任务来说,在所有相关概率都已知的情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。也就是说,贝叶斯分类器是最小错误率意义上原创 2017-04-08 17:28:45 · 708 阅读 · 0 评论 -
数据处理的统计学习(scikit-learn教程)
数据处理的统计学习(scikit-learn教程)http://mp.weixin.qq.com/s?__biz=MzA3MDg0MjgxNQ==&mid=2652390831&idx=1&sn=56551dad9c449d60e7bbb31b0b7c0a3e&chksm=84da457fb3adcc69392ad61ea3c3225ba0300a2dfa05259ae45c8a18b转载 2017-03-16 18:00:41 · 544 阅读 · 0 评论 -
特征选择
特征选择原创 2017-03-20 16:17:36 · 359 阅读 · 0 评论 -
支持向量机(下)
1.分类与回归其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。分类问题:,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测;回归问题:给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨翻译 2017-03-19 17:55:15 · 207 阅读 · 0 评论 -
支持向量机(中)
SVM思路:简单情况,线性可分,把问题转化为一个凸优化问题,可以用拉格朗日乘子法简化,然后用既有的算法解决。复杂情况,线性不可分,用映射函数将样本投射到高维空间,使其变成线性可分的情形。利用核函数来减少高维度计算量。1.核函数 实质上是一种映射函数,将低维空间非线性问题映射到高维空间编程线性问题进行处理.许多在低维空间难以处理的非线性分类问题,转换到高维空间和容易得到最优分类超平面,这是其最翻译 2017-03-19 16:44:27 · 597 阅读 · 0 评论 -
逻辑回归( Logistic regression)
逻辑回归( Logistic regression)http://www.mamicode.com/info-detail-501714.html https://baike.baidu.com/item/logistic%E5%9B%9E%E5%BD%92/2981575 http://blog.csdn.net/han_xiaoyang/article/details/49123419 h原创 2017-11-25 22:14:19 · 1256 阅读 · 0 评论