人工智能
文章平均质量分 82
马同学图解数学
这个作者很懒,什么都没留下…
展开
-
如何通俗地解释梯度下降法
如何通俗地解释梯度下降法原创 2022-05-31 10:13:46 · 3187 阅读 · 3 评论 -
如何理解线性判别分类器(LDA)?
感知机是机器学习中最基本的算法,纯粹靠样本点来进行分类。如果增加关于样本点的知识,比如像本文一样就可以得到 LDA 算法原创 2022-05-18 14:09:09 · 2626 阅读 · 0 评论 -
什么是机器学习?
这篇文章是我们机器学习《监督式学习》课程的一篇试读,感兴趣的同学可以查看我们的微信公众号:马同学高等数学,进一步了解课程。机器学习算是人工智能的一个分支,所以让我们从人工智能说起。1 人工智能精确定义人工智能很难,大概就是机器获得了类似人类的智慧,甚至成为了超人:很长的一段时间人工智能只是一个幻想,直到20世纪40年代电脑的出现,才有一批科学家开始严肃地探讨实现的可能性。经过快一个世纪的努力,逐渐取得了一些成果,比如自动驾驶:比如两足机器人:当然,这些离人原创 2020-09-16 10:12:22 · 930 阅读 · 0 评论 -
明天太阳一定会升起吗?兼谈拉普拉斯平滑
皮埃尔-西蒙,拉普拉斯侯爵(1749-1827),法国著名的天文学家和数学家:曾经提出一个问题:千百万年以来,每天太阳都会升起。但是,可以就此推断明天太阳一定会升起吗?1 火鸡问题这个问题似乎有点古怪,但仔细想想,如果不具备其它的关于太阳的知识,仅凭数据确实没有办法肯定地说,明天太阳一定会升起。英国哲学家波特兰.罗素曾经描述过一个类似的问题:一个农场里有一群火鸡,农场主每天中午十一点来给它们喂食。火鸡中的一名科学家观察这个现象,一直观察了近一年都没有例外,于是它在感恩节当天向所有火鸡原创 2020-06-29 10:38:39 · 2593 阅读 · 0 评论 -
如何直观地理解矩阵的秩?
矩阵的秩可以直观地理解为筛眼的大小:下面就来解释这句话是什么意思?1 矩阵的作用假设对于向量 x1 、 x2、 x3、x4 有:上述关系可以用图像来表示,左侧的向量 x1 、 x2、 x3、x4,在 A 的作用下,变为了右侧的向量 y1 、y2 、y3 、y4 :将各个向量依次连起来就得到了两个矩形。那么可以这么理解,左侧的矩形在 A 的作用下,变为了右侧的矩形:2 矩阵的秩如果 A 的秩不一样,那么左侧的矩形在 A 的作用下,右侧就可能得到不同的图形:有原创 2020-06-06 20:22:22 · 12943 阅读 · 1 评论 -
如何通俗地理解信息增益?
通俗来说,一句话、一段视频、一本书统统都可以称为信息。有的信息很干,我们就说它的“信息增益”大,而有的很水,那么就是“信息增益”小。1 选择朋友举个例子吧,比如因为工作原因,我新结识了一位小伙伴,现在想判断他是否值得交往,也就是想做一个“选择朋友”的决策。我择友的标准是“好人”,但是好坏不会写在人的脑门上,只能通过了解更多的信息来判断。信息知道的越多自然判断越准确。当然,有的信息“信息增益”低,对“选择朋友”这个决策帮助小。比如抽烟、喝酒这个信息对“选择朋友”帮助就不大,好人、坏人都抽烟喝酒原创 2020-05-22 15:21:51 · 1777 阅读 · 0 评论 -
为什么学习线性代数?
“为什么学习线性代数?线性代数到底在讲什么?”刚接触这门学科的同学可能都会提类似的问题。简短的回答就是:(1)我们所处的世界、宇宙太复杂了,很多现象都无法理解,更谈不上用数学去描述;(2)有一些符合特定条件的复杂问题,可以转化为简单的线性问题,线性问题就完全可以理解、完全可以被数学所描述(怎么把复杂问题转为线性问题是别的学科要解决的,比如说微积分);...原创 2019-12-19 12:03:07 · 7898 阅读 · 8 评论 -
如何通俗地理解熵?
熵,是一个热力学的概念。但在历史的发展中,造就了它非常丰富的内涵,进入了很多学科的视野。本文会在数理层面对它进行一个解读,厘清它在逻辑上到底是什么。1 混乱的熵很多科普文章中,都提到熵是用来度量混乱的。比如下面这幅动图,单词“Entropy”(熵的英文)可见的时候,熵最小,这个时候最有秩序;而被打乱的时候,熵开始增大,直到最后一片混乱,熵变成最大:熵之所以很重要,是因为它总结了宇宙...原创 2019-10-08 16:20:53 · 9073 阅读 · 0 评论 -
如何通俗地理解协方差和相关系数?
1 正相关与负相关1.1 相关性事物之间可能会有关系,这可以通过数据看出。比如要买房的人越多(下图的城镇化率可以简单理解为进城买房的人数),房价就越高,两者的关系称为正相关 :城镇化有另外一个反作用,降低出生率。城镇化和出生率之间的关系就是负相关 ,也就是说城镇化率越高、出生率会越低,所以说,“城镇化是最好的避孕药”:1.2 股票组合在现实生活中了解相关性是很有用处...原创 2019-06-25 10:13:03 · 6226 阅读 · 5 评论 -
如何理解二次型?
通过矩阵来研究二次函数(方程),这就是线性代数中二次型的重点。1 二次函数(方程)的特点1.1 二次函数最简单的一元二次函数就是:给它增加一次项不会改变形状:增加常数项就更不用说了,更不会改变形状。1.2 二次方程下面是一个二元二次方程:给它增加一次项也不会改变形状,只是看上去有些伸缩:1.3 小结对于二次函数或者二次方程,二次部分是主要部分...原创 2018-12-04 10:33:46 · 55267 阅读 · 35 评论 -
如何理解对数?
宫崎骏的电影《起风了》,里面的主角是一个飞机设计师,绘制图纸的时候总是手里拿了一个长条状的东西:这是什么东西?拿来干什么用的?还得从对数说起。1 在数轴上表示对数1.1 数轴和加法数轴上的数和后继的数之间是 的关系, , 。我们把它称为坐标系吧。把 的关系变成 ,数轴上的就全是偶数了。数轴还是那根数轴,可是坐标系变了,我们把它称为 坐标系吧。 坐标系中,上面的蓝...原创 2018-10-24 16:09:36 · 12884 阅读 · 4 评论 -
为什么偏导数连续,函数就可微?
多变量微积分里面有这么一个结论:如果函数 的偏导数 、 在点 连续,那么函数在该点可微。下面来解释这个结论,并且减弱这个结论的条件。先简单阐述下“连续”、“偏导数”、“可微”的意义,后面要用到。如果非常熟悉了,可以直接跳到最后一节“偏导数连续推出可微”。1 连续的含义通俗来说,用笔作画,不提笔画出来的曲线就是连续的:1.1 没有缝隙我们对连续的函数曲线的直观感受是没...原创 2018-10-23 17:50:27 · 134736 阅读 · 124 评论 -
如何理解三大微分中值定理?
微分中值定理是很重要的基础定理,很多定理都是以它为基础进行证明的。1 罗尔中值定理1.1 直觉这是往返跑:可以认为他从 点出发,经过一段时间又回到了 点,画成 (位移-时间)图就是:根据常识,因为要回到起点,中间必定有速度为0的点:拳击比赛中,步伐复杂:但不论怎样,只要最后回到起点,中间必定有速度为0的点:这就是罗尔中值定理。1.2 罗尔中值...原创 2018-10-25 16:43:40 · 26637 阅读 · 9 评论 -
如何理解最小二乘法?
最小平方法是十九世纪统计学的主题曲。 从许多方面来看, 它之于统计学就相当于十八世纪的微积分之于数学。----乔治·斯蒂格勒的《The History of Statistics》1 日用而不知来看一个生活中的例子。比如说,有五把尺子:用它们来分别测量一线段的长度,得到的数值分别为(颜色指不同的尺子):之所以出现不同的值可能因为: 不同厂家的尺子的生产精度不同 ...原创 2018-07-20 10:14:09 · 249229 阅读 · 183 评论 -
如何通俗理解贝叶斯推断与beta分布?
有一枚硬币(不知道它是否公平),假如抛了三次,三次都是“花”:能够说明它两面都是“花”吗?1 贝叶斯推断按照传统的算法,抛了三次得到三次“花”,那么“花”的概率应该是:但是抛三次实在太少了,完全有可能是运气问题。我们应该怎么办?托马斯·贝叶斯(1702-1761),18世纪英国数学家,1742年成为英国皇家学会会员。贝叶斯认为在实验之前,应根据不同的情况对硬...原创 2018-07-19 14:32:45 · 9572 阅读 · 1 评论 -
如何通俗理解泊松分布?
1 甜在心馒头店公司楼下有家馒头店:每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):均值为:按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,的时间不够卖:你“甜在心馒头店”又不是...原创 2019-04-12 14:48:40 · 450500 阅读 · 148 评论 -
如何理解拉格朗日乘子法?
1 与原点的最短距离假如有方程:图像是这个样子滴:现在我们想求其上的点与原点的最短距离:这里介绍一种解题思路。首先,与原点距离为 的点全部在半径为 的圆上:那么,我们逐渐扩大圆的半径:显然,第一次与 相交的点就是距离原点最近的点:此时,圆和曲线相切,也就是在该点切线相同:至此,我们分析出了:2 等高线为了继续解题,需要引入等高...原创 2018-08-01 10:53:21 · 24998 阅读 · 22 评论 -
如何理解拉格朗日乘子法和KKT条件?
之前简单介绍了拉格朗日乘子法的基本思路:如何理解拉格朗日乘子法?本文会继续介绍拉格朗日乘子法的细节,以及对其进行适当的推广(也就是所谓的KKT条件)。1 无约束下的极值1.1 直观根据梯度的意义(参看如何理解梯度)可知,在函数 的极值点梯度为0:1.2 代数要求( 的意思是求极小值):只需解如下方程:2 单等式约束下的极值关于这一节,更详细的请参看:...原创 2018-08-18 19:13:39 · 5115 阅读 · 6 评论 -
如何通俗易懂地讲解牛顿迭代法?
五次及以上多项式方程没有根式解(就是没有像二次方程那样的万能公式),这个是被伽罗瓦用群论做出的最著名的结论。但是,没有王屠夫难道非得吃带毛猪?工作生活中还是有诸多求解高次方程的真实需求(比如行星的轨道计算,往往就是涉及到很复杂的高次方程),这日子可怎么过下去啊?没有根式解不意味着方程解不出来,数学家也提供了很多方法,牛顿迭代法就是其中一种。1 切线是曲线的线性逼近要讲牛顿迭代法之前...原创 2018-08-19 13:02:37 · 123730 阅读 · 23 评论 -
如何理解主元分析(PCA)?
主元分析也就是PCA,主要用于数据降维。1 什么是降维?比如说有如下的房价数据:这种一维数据可以直接放在实数轴上:不过数据还需要处理下,假设房价样本用 表示,那么均值为:然后以均值 为原点:以 为原点的意思是,以 为0,那么上述表格的数字就需要修改下:这个过程称为“中心化”。“中心化”处理的原因是,这些数字后继会参与统计运算,比如求样本方差,中间就包...原创 2018-08-31 12:14:03 · 19113 阅读 · 4 评论 -
从拉格朗日插值法到范德蒙行列式
之前我写过一篇文章:如何理解牛顿插值法?其中解释了什么是插值法?为什么要有插值法?大家对此感兴趣可以去看看。还有另外一种插值法,叫做拉格朗日插值法,也是以大牛冠名的,我们来看看它是怎么推导的?1 拉格朗日插值法比如说,已知下面这几个点,我想找到一根穿过它们的曲线:使用多项式画出这根曲线是完全可行的,关于这点可以参看我写的如何理解泰勒公式?。我们可以合理的假设,这根曲线是一个...原创 2018-08-31 12:26:09 · 5258 阅读 · 0 评论 -
如何理解无偏估计量?
现实中常常有这样的问题,比如,想知道全体女性的身高均值 ,但是没有办法把每个女性都进行测量,只有抽样一些女性来估计全体女性的身高:那么根据抽样数据怎么进行推断?什么样的推断方法可以称为“好”?1 无偏性比如说我们采样到的女性身高分别为:那么:是对 不错的一个估计,为什么?因为它是无偏估计。首先,真正的全体女性的身高均值 ,我们是不知道,只有上帝才知道,在图中就画...原创 2018-09-15 16:49:04 · 52575 阅读 · 6 评论 -
如何通俗地理解卷积?
从数学上讲,卷积就是一种运算。某种运算,能被定义出来,至少有以下特征: 首先是抽象的、符号化的 其次,在生活、科研中,有着广泛的作用 比如加法: ,是抽象的,本身只是一个数学符号 在现实中,有非常多的意义,比如增加、合成、旋转等等 卷积,是我们学习高等数学之后,新接触的一种运算,因为涉及到积分、级数,所以看起来觉得很复杂。1 卷积的定义我们称 ...原创 2018-07-20 10:21:10 · 11408 阅读 · 1 评论