机器学习
文章平均质量分 93
机器学习核心汇总
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
SoWhat1412
微信搜索【SoWhat1412】,第一时间阅读原创干货文章。人之患、在好为人师、不实知、谨慎言。点点滴滴、皆是学问、看到了、学到了、便是收获、便是进步。
展开
-
【机器学习】方差为何除以n-1
设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式: 很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。无偏估计 以例...转载 2018-06-22 09:47:46 · 4248 阅读 · 8 评论 -
【机器学习】简单例子讲解矩阵求导
前提及说明第一次遇见矩阵求导,大多数人都是一头雾水,而搜了维基百科看也还是云里雾里,一堆的名词和一堆的表格到底都是什么呢?这里总结了我个人的学习经验,并且通过一个例子可以让你感受如何进行矩阵求导,下次再遇到需要进行矩阵求导的地方就不会措手不及。在进行概念的解说之前,首先大家需要先知道下面的这个前提:前提:若xx为向量,则默认xx为列向量,xTxT为行向量布局的概念...原创 2018-06-04 19:47:10 · 8133 阅读 · 3 评论 -
【机器学习】 SVM 全程讲解
支持向量机(SVM),一个神秘而众知的名字,在其出来就受到了莫大的追捧,号称最优秀的分类算法之一,以其简单的理论构造了复杂的算法,又以其简单的用法实现了复杂的问题,不得不说确实完美。SVM讲解链接本系列旨在以基础化的过程,实例化的形式一探SVM的究竟。曾经也只用过集成化的SVM软件包,效果确实好。因为众人皆说原理复杂就对其原理却没怎么研究,最近经过一段时间的研究感觉其原理还是可以理解,这...原创 2018-05-27 09:44:59 · 1291 阅读 · 7 评论 -
【机器学习】实战系列
机器学习实战系列课本代码及数据李航理论知识点总结1、Python3《机器学习实战》学习笔记(一):k-近邻算法(史诗级干货长文)2、Python3《机器学习实战》学习笔记(二):决策树基础篇之让我们从相亲说起3、Python3《机器学习实战》学习笔记(三):决策树实战篇之为自己配个隐形眼镜4、Python3...原创 2018-05-22 09:36:20 · 7739 阅读 · 4 评论 -
【机器学习】均方误差(MSE)和均方根误差(RMSE)和平均绝对误差(MAE)
MSE: Mean Squared Error均方误差是指参数估计值与参数真值之差平方的期望值;MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。RMSE均方误差:均方根误差是均方误差的算术平方根MAE :Mean Absolute Error平均绝对误差是绝对误差的平均值平均绝对误差能更好...原创 2018-08-24 21:20:37 · 97334 阅读 · 7 评论 -
【机器学习】李航 统计学习方法 知识点总结
机器学习实战代码阅读目录知识点 感知机 k近邻法 朴素贝叶斯 决策树 logistic回归和最大熵模型 支持向量机 提升方法 EM算法 隐马尔可夫模型(HMM) 统计学习方法总结 神经网络 K-Means Bagging Apriori 降维方法 引用因为要准备面试,本文以李航的《统计学习方法》为主,结合西瓜书等其他资料对机器学习知识做一个整理.知识点...原创 2019-06-21 10:43:42 · 17806 阅读 · 6 评论 -
【机器学习】生成模型 判别模型
这篇博客是自己在学习生成模型与判别模型过程中的一些记录,整理了相关的文章后写成,感谢前辈们的辛苦总结简单的说,生成模型是从大量的数据中找规律,属于统计学习;而判别模型只关心不同类型的数据的差别,利用差别来分类。两个模型是啥我们从几句话进入这两个概念:1、机器学习分为有监督的机器学习和无监督的机器学习;2、有监督的机器学习就是已知训练集数据的类别情况来训练分类器,无监督的机器学习...转载 2019-06-19 17:30:15 · 11276 阅读 · 4 评论 -
【机器学习】LDA 浅谈
1 Linear Discriminant Analysis 相较于FLD(Fisher Linear Decriminant),LDA假设:1.样本数据服从正态分布,2.各类得协方差相等。虽然这些在实际中不一定满足,但是LDA被证明是非常有效的降维方法,其线性模型对于噪音的鲁棒性效果比较好,不容易过拟合。2 二分类问题 原理小结:对于二分类LDA问题,简单点...原创 2018-10-10 10:01:27 · 737 阅读 · 3 评论 -
【机器学习】EM算法详细推导和讲解
今天不太想学习,炒个冷饭,讲讲机器学习十大算法里有名的EM算法,文章里面有些个人理解,如有错漏,还请读者不吝赐教。 众所周知,极大似然估计是一种应用很广泛的参数估计方法。例如我手头有一些东北人的身高的数据,又知道身高的概率模型是高斯分布,那么利用极大化似然函数的方法可以估计出高斯分布的两个参数,均值和方差。这个方法基本上所有概率课本上都会讲,我这就不多说了,不清楚的请百度。 然而现在...原创 2018-10-14 17:06:00 · 10483 阅读 · 0 评论 -
【机器学习】极大似然估计详解
我们假设硬币有两面,一面是“花”,一面是“字”。 一般来说,我们都觉得硬币是公平的,也就是“花”和“字”出现的概率是差不多的。 如果我扔了100次硬币,100次出现的都是“花”。 在这样的事实下,我觉得似乎硬币的参数不是公平的。你硬要说是公平的,那就是侮辱我的智商。 这种通过事实,反过来猜测硬币的情况,就是似然。 而且,我觉得最有可能的硬币的情况是,...原创 2018-10-14 15:49:29 · 8819 阅读 · 4 评论 -
【机器学习】常见问题
1.请简要介绍下SVM。SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开。扩展:支持向量机学习方法包括构建由简至繁的模型:线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时,通过硬间隔最大化,学习一个线性的分类器,即线性可分支持向量机,又称为硬间...原创 2018-09-25 14:28:35 · 17288 阅读 · 2 评论 -
【机器学习】PCA原理分析
PCA数学原理,方差最大化跟误差最小化讲解声明:参考:PCA数学原理、维基百科PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍P...原创 2018-09-08 11:29:32 · 18505 阅读 · 10 评论 -
【机器学习】准确率、精确率、召回率
纠正下,精确率(precision)和准确率(accuracy)是不一样的,题主问的应该是精确率与召回率之间的差别。Blog一.定义辨析- TP,True Positive- FP,False Positive- TN,True Negative- FN,False Negative精确率:precision = TP / (TP + FP) 分母是预测为正的样本数召回率...原创 2017-12-01 09:25:47 · 1718 阅读 · 0 评论 -
【机器学习】 最形象的入门
在听到人们谈论机器学习的时候,你是不是对它的涵义只有几个模糊的认识呢?你是不是已经厌倦了在和同事交谈时只能一直点头?让我们改变一下吧!本指南的读者对象是所有对机器学习有求知欲但却不知道如何开头的朋友。我猜很多人已经读过了“机器学习”的维基百科词条,倍感挫折,以为没人能给出一个高层次的解释。本文就是你们想要的东西。本文目标在于平易近人,这意味着文中有大量的概括。但是谁在乎这些呢?只要能让读者...原创 2017-11-20 20:37:04 · 668 阅读 · 1 评论 -
【机器学习】 通俗说拟合
import numpy as npimport matplotlib.pyplot as pltx = [1,2,3,4,5,6,7,8,9]y = [0.199,0.389,0.580,0.783,0.980,1.177,1.380,1.575,1.711]t1=t2=t3=t4=0n = len(x)for i in range(n): t1+=y[i] t2...原创 2017-11-18 11:35:36 · 928 阅读 · 2 评论 -
【机器学习】浅谈协方差
协方差协方差blog n-1 matlab中是按照列统计的,协方差矩阵 中主对角线是方差值/(n-1) ,主对角线两边是围绕主对角线对称的描述的是不同维度之间的关联关系。。。统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给...原创 2018-01-18 11:59:08 · 530 阅读 · 0 评论 -
【机器学习】大数定律,中心极限定律 极大似然估计
大数定律 当数据量很大的时候可以用频率表示概率, 在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。中心极限定理 样本的平均值约等于总体的平均值。 不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。 除以n和n-1 中心极限定理一.中心极限定理下图形象的说明了中心极限定理...原创 2018-02-22 13:52:15 · 8586 阅读 · 4 评论 -
【机器学习】贝叶斯定理、精准推断、最大似然估计、连续特征参数估计、EM算法
贝叶斯定理、精准推断、最大似然估计、连续特征参数估计、EM算法参考link,GMM通俗理解先验概率:事情未发生,根据以往经验估计事情发生概率后验概率:事情已经发生,根据事实去估计最可能导致此事发生的参数。最大似然估计:根据已经发生的事情,随机估计多个概率模型,然后最大概率下发生此事的最大概率模型。在统计学中,最大似然估计(英语:maximum likelihood estima...原创 2019-06-18 08:58:02 · 825 阅读 · 0 评论