人工智能之旅
文章平均质量分 94
记录学习人工智能的点滴,知其然,并知其所以然~
breakloop
芸芸众生,你总得做点特别的事情。不是矫情,只是不想凑合罢了。
展开
-
我的人工智能之旅——假设函数模型的选择
如何选择假设函数模型通常假设函数的模型为,其中n为最高次数,那么如何来确定n的取值呢?通常的做法是,(1)确定多个n值,例如,形成多个假设函数(2)将数据集分成三部分,训练集,交叉验证集,测试集,通常所占比例分别为60%,20%,20%。(注意,测试集选定后,不再变动。)(3)使用训练集对不同的假设函数模型进行训练,确定最优参数。(注意,在训练过程中,需要假如正则化惩罚...原创 2018-10-12 10:12:53 · 884 阅读 · 1 评论 -
我的人工智能之旅——概率统计基础(更新中)
偏差体现的是,学习算法的期望预测与真实结果的偏离程度。通常出现在欠拟合的情况下。方差体现的是,同样大小的训练集的变动所导致的学习性能的变化。通常出现在过拟合的情况下。训练效果不错,但测试效果不好。数学期望,即平均值。公式为方差是指,每个样本值与全体样本值的平均数之差的平方值的平均数。公式为均方差即为标准差,是方差的算术平方根。公式为均方误差,与均方差一字之差,但却与方差相近,将...原创 2018-10-12 11:12:02 · 1068 阅读 · 1 评论 -
我的人工智能之旅——偏斜类问题
偏斜类问题正样本数占样本总数的比例极小时,容易出现偏斜类问题。例如癌症测试。样本集合中仅有0.5%的癌症样本,99.5%的正常样本。通过某一假设函数后,得到1%为癌症患者,99%为正常样本。虽然总的正确率高达99%,但假设函数并不理想。因为,我们的目的是为了,检测出是否得癌。这时候,如果将99%的准确率提升至99.2%,无疑是一个较大的提升,虽然,在数值上来看,只有0.2%。因此,...原创 2018-10-16 15:14:54 · 965 阅读 · 0 评论 -
我的人工智能之旅——引子
人工智能不想人云亦云,于是来刨别家祖坟,一探究竟。人工智能,一个热得不知所措的话题。就跟当年的“云”一样,聊得臭大街了,但什么是云?就想把你绕晕,其实都在云里雾里。人工智能,artificial intelligence,缩写AI。由于命名的开放性,使得其定义轮廓较为模糊。简单来说,它是计算机学科的分支之一,是使用计算机模拟和学习人类思维过程和智能行为的学科。人工智能已经存在人们身边很...原创 2018-08-31 14:19:31 · 469 阅读 · 0 评论 -
我的人工智能之旅——近邻算法KNN(K-Nearest Neighbor)
在图像识别中,图像分类是首要工作。因为需要将不同类型的图像先进行排除。近邻算法是最简单的算法之一,但由于其弊端的存在,本篇只做了解性的简单介绍,K近邻算法的实质将测试图片在已经分类好的,具有不同标签的训练数据图片中,找到K张最相似的图片,进而根据K张图片中类型的比例大小,推断图片类型。判断图片的相似程度,就需要用到距离算法。我们知道,图片的电子存在形式是多维的矩阵数据,不同的维度代表区域(...原创 2018-10-09 10:30:49 · 1061 阅读 · 0 评论 -
我的人工智能之旅——线性代数基础
1.矩阵矩阵,matrix,为m行n列的数据阵列。例如下例,为4x3阶矩阵。2.方阵mxn阶矩阵的m=n时,称为方阵,n阶方阵。3.单位矩阵单位矩阵,是指对角线数据为1,其它数据为0的n阶方阵。4.逆矩阵逆矩阵,matrix inverse。只有方阵才有逆矩阵。n阶矩阵A的逆矩阵,必须满足以下条件其中I为n阶单位矩阵。不是所有的矩阵都有逆矩阵。对...原创 2018-08-31 14:25:41 · 2233 阅读 · 0 评论 -
我的人工智能之旅——线性回归
本文将涉及以下知识点(1)线性关系(2)线性回归(3)假设函数(4)代价函数(5)学习速率(6)梯度下降(7)特征向量相关的线性代数或微积分知识,可参照另两篇博文我的人工智能之旅----线性代数基础知识我的人工智能之旅----微积分基础知识以下是正文。线性关系解释线性回归之前,先来看一下线性关系。什么是线性关系?如果自变量与因变量存在一次方函...原创 2018-08-31 14:20:39 · 5588 阅读 · 1 评论 -
我的人工智能之旅——微积分基础
1.导数从一元函数图像上看,某一点的导数,即曲线在该点的切线。一个函数在某一点的导数,描述了这个函数在这一点附近的变化率。当函数f(x)的自变量,在一点x上产生了一个增量h,若因变量的增量与自变量h的比值,在h趋于0时的极限如果存在,那该比值即为f(x)在点x处的导数。这里要注意一下几点(1)不是所有的函数都是可导的。(2)可导的函数一定是连续的。(3)不连续的函数...原创 2018-08-31 14:25:55 · 6263 阅读 · 0 评论 -
我的人工智能之旅——梯度下降vs正规方程法
本文将涉及以下知识点(1)特征缩放(2)均值归一化(3)正规方程优化梯度下降算法在上一篇博文中,我们了解了梯度下降算法,它为解决线性回归问题提供了思路。但梯度下降的迭代推算过程,较为耗时。简单地说,整个算法是一个不断尝试收敛的过程。如果能够降低算法的尝试次数,以及每次迭代的算法复杂度,那么,便能更高效的解决线性回归问题。影响梯度下降算法收敛速度的因素很多,例如样本集合大小,...原创 2018-08-31 14:23:39 · 1875 阅读 · 0 评论 -
我的人工智能之旅——逻辑回归
本文,将涉及以下知识点,(1)决策边界,decision boundary(2)凸函数,convex function(3)非凸函数,non convex function此前所讨论的问题,都为线性回归问题。本文将介绍逻辑回归算法,该算法为分类问题提出解决方案。正文如下逻辑回归逻辑回归,logistic regression,由于历史问题,算法名称中包含“回归”字样,但其解...原创 2018-08-31 14:21:00 · 1335 阅读 · 0 评论 -
我的人工智能之旅——基本数学基础
1.自然常数自然常数e,为无限不循环小数,数值约为2.71828...,其数学定义为,即。2.幂&指数幂(power),是指乘方运算的结果。是指x个a相乘,称为a的x次幂。其中,a为底数,x为指数。指数运算,也称为幂运算。常用的幂运算公式如下:(1)(2)(3)(4)(5)(6),其中(7),其中3.对数若,其中a>0且a1,则,a...原创 2018-08-31 14:26:16 · 3429 阅读 · 1 评论 -
我的人工智能之旅——正则化
无论线性回归,还是逻辑回归,都需要对假设函数进行设定。而假设函数的设定,将影响到预测结果的准确性。因此,如何判断假设函数是否合适,以及如何修改假设函数将变得十分重要。本文,我们将记录假设函数的正则化。在记录的过程当中,将涉及以下概念。(1)过度拟合,overfitting(2)欠拟合,underfitting(3)正则化,regularization(4)惩罚项(或正则化项),pe...原创 2018-08-31 14:25:13 · 945 阅读 · 0 评论 -
我的人工智能之旅——神经网络
神经元,neuron神经网络,Neural Networks激活函数,activation function权重,weight输入层,input layer输出层,output layer隐藏层,hidden layer向前传播,forward propagation人工神经网络人工神经网络是一种机器学习算法,兴起于上世纪八九十年代,但由于其本身计算量较大,受制...原创 2018-08-31 14:39:02 · 2622 阅读 · 0 评论