CS229
PC_CS
这个作者很懒,什么都没留下…
展开
-
CS229决策树
CS229决策树构建树熵三级目录构建树我们想知道在哪些地方可以愉快的滑雪。经过调查我们发现一下规律:横坐标是时间以月份划分,纵坐标是纬度范围为-90—90。图中绿色+号表示可以滑雪,红色圆圈为不可以滑雪。如果我们想用线性划分可以滑雪和不可以滑雪,显然是不可能的。虽然我们可以采用SVM中的核方法构建非线性划分。但是我们可不可以通过对数据中的特征选择,直接选择最终的结果。接下我们就要构建决策树(Decision Trees)。首先以数据特征中一种设置区分阈值,选着分界线(Split)。比如首先以纬度L原创 2020-09-12 21:37:12 · 391 阅读 · 0 评论 -
CS229SVM支持向量机
CS229SVM支持向量机函数间隔和几何间隔函数间隔二级目录三级目录函数间隔和几何间隔逻辑回归hθ(x)=g(θTx)h_\theta( x)=g(\theta^T x)hθ(x)=g(θTx)其中的θ是{θ0\theta_0θ0,θ1\theta_1θ1…θn\theta_nθn},这里我们用w=θ1,...,θnw={\theta_1,...,\theta_n}w=θ1,...,θn,b=θ0\theta_0θ0,进而得到hw,b(x)=g(wTx+b)h_{w,b}( x)=g(w^原创 2020-08-20 13:02:35 · 285 阅读 · 0 评论 -
CS229朴素贝叶斯与拉普拉斯平滑
朴素贝叶斯与拉普拉斯平滑朴素贝叶斯理论拉普拉斯平滑多相式事件模型朴素贝叶斯理论判断一封邮件是否是垃圾邮件。首先在单词字典中(Vocabulary dictionary)列出所有的单词列表。假设字典中有100000个单词。然后设一个向量X,当一封邮件中的单词出现在字典中时,对应字典中的位置Xi为1,若字典中没有该单词则为0。如下图所示:当邮件中存在buy和a这两个单词时,假设邮件中出现的每一个单词时相互独立的,就是说邮件是由随机生成的单词组成,(这就是朴素的原因)这我们去表现一封邮件的概率为:我原创 2020-07-28 22:10:34 · 306 阅读 · 0 评论 -
CS229局部加权线性回归
在线性回归中,由于最终拟合出来的曲线是一条直线,其拟合能力极为有限(也可以解释为线性回归所求的是具有最小均方误差的无偏估计)一次很容易出现欠拟合的现象,针对这个问题我们提出局部加权线性回归(LWLR)LWLR的思想:我们对一个输入x进行预测时,赋予x周围点不同的权值,距离x越近,权重越高,...原创 2020-07-28 21:13:11 · 142 阅读 · 0 评论 -
CS229逻辑回归
逻辑回归的提出在二分类问题中我们需要将离散的数据进行归类,首先我们规定正向类和负向类分别用1和0表示。按照一般我们使用线性分类处理,公式如下:这时输出的y可能会远大于1或者远小于1,这时我们像能不能将输出值限制在0到1之间。函数模型将逻辑回归的输出变量的范围规定在0,1之间,其模型的假设是:其中g函数使用sigmoid函数:将z用线性组合代替:函数图像为:h函数的作用在于对于给定输入变量,根据选择的参数计算输出变量=1的可能性,即在逻辑回归中,我们预测:当大于等于0.5的时候原创 2020-07-20 23:42:52 · 233 阅读 · 0 评论 -
CS229高斯判别分析
高斯判别分析基本原理算法解析基本原理在二分类中逻辑回归是通过不断优化θ\thetaθ参数,找到最合适的分类界限。而高斯判别分析法采用先通过数据特征建立类别模型,然后在寻找分界线分类。简单来说我们要进行区分猫和狗,逻辑回归分析法就是找到猫和狗的分界线,当新的猫狗要判断这种方法只会确定猫狗在分界线的那一边,也就说它并不能解释什么是猫什么是狗。而高斯判别分析是一种生成学习方法,通过猫狗的数据,建立起猫和狗的模型我们会知道什么是猫什么是狗,当新的数据进来时我们将数据样本和猫狗模型分别对别,看它与哪一个模型相似原创 2020-07-20 23:41:10 · 262 阅读 · 0 评论