机器学习中的数学
司南牧
立志让初学者跨界学编程/算法/AI机器人无障碍专注零基础教程,知乎@司南牧
展开
-
概率质量(mass)函数和概率密度(density)函数区别
答:他们是同一个东西,不同名字。就像人类,有些叫做男人有些叫做女人,一样的道理。描述离散型数据的概率叫做概率分布函数,描述连续型数据叫做概率密度函数。概率分布函数:各个分类的概率。概率密度函数:数据落在某一段连续的区间的概率。概率分布函数概率密度函数...原创 2019-05-06 14:56:29 · 9686 阅读 · 0 评论 -
史上最易懂的最小二乘法实践:线性最小二乘法推导与Python求解编程教程
最小二乘法有什么用?一般用它做什么事?我们最早接触最小二乘法是在高中的时候学的。最小二乘法一般被用来拟合数据。什么叫做拟合数据?就是给定你一堆数据,然后你假设这些数据是满足某种函数的,比如你假设这些数据是一条直线。现在问题来了到底这些数据所对应的那条直线斜率是多少截距是多少?这就得用最小二乘法来求解。总结:最小二乘法拟合数据的步骤有两步。1.首先,假设这些数据符合某种函数。而这种函数往往有几...原创 2019-09-26 19:16:59 · 1109 阅读 · 0 评论 -
我是如何十分钟复习概率论基础知识?
概率论中那些符号联合概率p(x,y) = x和y同时发生的概率。当x与y是两个没有任何联系的事情的时候那么p(x,y)=p(x)p(y)。比如:你今天是否吃饭这个事和太阳是否从东边出来这就是两个没有任何联系的事。你今天吃不吃饭跟太阳出不出来并没有任何关系。两件事没有任何联系在学术上叫做这两件事相互独立,你这件事发生不干扰我,我这件事发生也不干扰你。条件概率那有哪些事件是不相互独立的呢?你今...原创 2019-07-28 21:02:28 · 4106 阅读 · 1 评论 -
梳理常见基本的概率分布函数及他们在机器学习中的作用
在机器学习许多算法里面经常用到的一个建模技巧就是假定某个数据服从某个概率分布。每个概率分布都有一个概率分布函数,输入样本值概率分布函数输出当前这个样本属于某个类的概率。而任何概率分布函数都会存在未知参数,不同数据要取不同的参数。比如逻辑回归,它就认为概率分布函数长的像这样,输入样本值x,输出x属于标签为1的那个类的概率。未知参数是w和b,不同数据w和b是要取不同的值。逻辑回归要做的是根据不同数据自...原创 2019-06-03 14:36:43 · 2542 阅读 · 0 评论 -
挖掘商品关联性(2): FP-growth算法
在前面我们介绍了一种简单的挖掘商品关联性算法Aporiori算法。原创 2019-05-28 11:38:47 · 2785 阅读 · 0 评论 -
啤酒与尿布?挖掘商品之间的关联性分析(1):机器学习之Apriori算法
1. 背景一个广为流传的挖掘商品之间的关联性的故事就是“啤酒与尿布”这个故事。相传某超市通过分析顾客的账单,发现啤酒总是和尿布一起购买。通过分析,发现这是因为美国人喜欢喝啤酒,当买尿布的时候看到啤酒就顺便买了。于是就把啤酒与尿布总是放在一起卖。这样的有关联性的商品还有很多。如洋葱和土豆捆绑消费等等。将关联度高的商品放在一起促销或者捆绑消费可以提高营业额。同时电商平台也可以捆绑推荐提高成交量。而当...原创 2019-05-27 21:35:08 · 9106 阅读 · 0 评论 -
贝叶斯公式在机器学习中有什么用,实例讲解Python实现朴素贝叶斯分类器
贝叶斯公式=贝叶斯定理贝叶斯公式到底想说啥贝叶斯公式就是想用概率数学来表示事件发生依赖关系。贝叶斯公式长下面这样:用图形怎么表示贝叶斯公式P(X=x)P(X=x)P(X=x)就是X的面积。P(Y=y)P(Y=y)P(Y=y)就是Y的面积。P(X=x∣Y=y)P(X=x|Y=y)P(X=x∣Y=y)是什么?P(X=x∣Y=y)P(X=x|Y=y)P(X=x∣Y=y)是指Y发生的情况下...原创 2019-05-22 21:11:34 · 1090 阅读 · 0 评论 -
adaboost理解
基本原理Adaboost算法基本原理就是将多个弱分类器(弱分类器一般选用单层决策树)进行合理的结合,使其成为一个强分类器。Adaboost采用迭代的思想,每次迭代只训练一个弱分类器,训练好的弱分类器将参与下一次迭代的使用。也就是说,在第N次迭代中,一共就有N个弱分类器,其中N-1个是以前训练好的,其各种参数都不再改变,本次训练第N个分类器。其中弱分类器的关系是第N个弱分类器更可能分对前N-...转载 2019-05-25 21:22:16 · 434 阅读 · 0 评论 -
通俗解释高中生能听懂的SVM本质和原理
当年SVM怎么被发明的?任何机器学习都是套一个数学模型,然后求解数学模型的待求解参数。SVM使用的是怎样的一个模型呢?。现在把我们作为一发明者,看看下面这张图。知道一个算法原理最好的方法是研究它是怎么想出来的,不然直接看公式可能马上就记住了,但是过了段时间就会忘因为没有理解。如果是下面这张图,我们怎么划分开这两组数据?最简单的方式就是用一条直线。现在我们已经发明了一种算法(事实上别人已经发明了...原创 2019-05-24 21:06:18 · 2047 阅读 · 1 评论 -
遇到问题,有哪些有效的分析方法?
作者:Ai酱这个方法为什么叫这个名字?如果是我们自己做我会怎么设计?为什么提出者能想到这个想法?一直问为什么来找方向,自己去尝试解释为什么通过问这三个问题让我们看到一个概念时候就方向感,知道从哪入手。万事开头难。我用这几个问题问自己悟出这个回答:计算机生态圈是怎么样的?。就拿香农的《信息熵=》来讲。是不是完全不懂“信息熵”是什么?怎么学?从哪学?查定义也似懂非懂。这个难度绝对是超过...原创 2019-05-11 13:22:16 · 901 阅读 · 0 评论 -
适合初学者的神经网络理论到实践(3): 概率统计与机器学习神经网络的联系?
欢迎关注博主或CSDN专栏《适合初学者的神经网络机器学习理论到实践入门》统计就是根据样本估计总体的概率分布。概率是已知总体概率分布,求某个样本的概率。举个高中常见的例子:什么是统计?:不知道袋子里面多少球,现在从袋子取5次球。发现4次是红,1次是白。然后我们估计这个袋子红白比例可能是4:1。这就是统计,根据抽样来估计整体的样本分布规律。什么是概率?:已知袋子有10个球,红球8个,白...原创 2019-04-26 16:34:55 · 1068 阅读 · 0 评论 -
[编辑推荐|易懂]如何理解论文中的那些评估方法性能指标概念名词{召回率 ROC AUC 交叉验证} 适合初学者的神经网络 实战 理论 实践(6)
适合初学者的神经网络 实战 理论 实践(6)[易懂]如何理解论文中的那些评估方法性能指标概念名词{召回率 ROC AUC 交叉验证}作者:知乎 Ai酱首发于:知乎专栏《适合初学者的机器学习神经网络理论到实践》假设现在我们论文是要识别垃圾邮件。将邮件分类为垃圾邮件和非垃圾邮件。好了接下来通过垃圾邮件这个例子说明别人论文中常常出现的评估方法性能的概念名字是什么意思。假如我输入了...原创 2019-05-10 10:38:21 · 492 阅读 · 2 评论 -
如何理解Bayes贝叶斯公式|如何理解极大似然法|这两个有什么关系?贝叶斯定理是什么|贝叶斯公式在机器学习中有什么用?
如何理解贝叶斯定理|公式?贝叶斯公式到底想说啥?如何理解极大似然法|这两个有什么关系?它怎么来的?用图形表示是什么样子。贝叶斯定理是什么|贝叶斯公式在机器学习中有什么用?原创 2019-05-06 19:05:55 · 915 阅读 · 0 评论 -
如何理解无偏估计?无偏估计有什么用?什么是无偏估计?
如何理解无偏估计无偏估计:就是我认为所有样本出现的概率一样。假如有N个样本我们认为所有样本出现概率都是1/N。然后根据这个来计算数学期望。此时的数学期望就是我们平常讲的平均值。数学期望本质就是平均值无偏估计为何叫做“无偏”?它要“估计”什么?回答第二个问题,它要估计的是整体的数学期望(平均值)。那为何叫做无偏?有偏是什么?假设这个是一些样本的集合X=x1,x2,..,xi,xN...原创 2019-05-06 17:14:37 · 33345 阅读 · 9 评论 -
通俗易懂最小二乘法与牛顿法总结:线性与非线性,文末有Python和c++代码编程实践教程
今日疯言疯语:很多算法看不懂大概率是这些算法做出的一些假设你不知道——@Ai酱线性最小二乘法||Ax-y||可以直接求解问题:已知A和y,需要求x。并且需要最小化||Ax-y||。下面是求解x的方法:Ax=yATAx=ATyx=(ATA)−1ATyAx=y \\A^TAx = A^Ty\\x = (A^TA)^{-1}A^TyAx=yATAx=ATyx=(ATA)−1ATy之所...原创 2019-09-28 20:50:07 · 1049 阅读 · 1 评论