机器学习
文章平均质量分 96
风雪云侠
这个作者很懒,什么都没留下…
展开
-
机器学习之朴素贝叶斯学习笔记
朴素贝叶斯一、概述朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。二、朴素贝叶斯理论朴素贝叶斯是贝叶斯决策理论的一部分,所以在学习朴素贝叶斯之前有必要快速了解一下贝叶斯决策理论。1、贝叶斯决策理论假设现在我们有一个数据集,它由两类数据组原创 2021-01-18 20:44:08 · 4168 阅读 · 0 评论 -
机器学习之决策树学习笔记
决策树1、决策树的概念决策树是什么?决策树(decision tree)是一种基本的分类与回归方法,通俗的讲也就是一颗用于决策的树。决策树长什么样呢?举个通俗易懂的例子,如下图所示的流程图就是一个决策树。这个决策树中,长方形代表判断模块(decision block),也就是用于条件判断的模块。椭圆形代表终止模块(terminating block),表示已经得出结论,可以终止运行。从判断模块引出的左右箭头称作为分支(branch),它可以达到另一个判断模块或者终止模块。回到这个流程图,原创 2021-01-14 11:12:48 · 547 阅读 · 0 评论 -
机器学习之K-近邻算法学习笔记
K-近邻算法1、k-近邻法简介k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理是:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新的数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的原创 2021-01-09 15:28:39 · 410 阅读 · 0 评论 -
机器学习术语表
机器学习术语表A/B 测试 (A/B testing)一种统计方法,用于将两种或多种技术进行比较,通常是将当前采用的技术与新技术进行比较。A/B 测试不仅旨在确定哪种技术的效果更好,而且还有助于了解相应差异是否具有显著的统计意义。A/B 测试通常是采用一种衡量方式对两种技术进行比较,但也适用于任意有限数量的技术和衡量方式。...原创 2020-12-28 16:31:16 · 179 阅读 · 0 评论 -
机器学习笔记——感知机和统计学习方法(二)
感知机和统计学习方法感知机1、输入为实例的特征向量,输出为实例的类别,取+1和-1;2、感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型;3、导入基于误分类的损失函数;4、利用梯度下降法对损失函数进行极小化;感知机学习算法具有简单而易于实现的优点,分为原始形式和对偶形式;1957年由Rosenblatt提出,是神经网络与支持向量机的基础。定义(感知机):假设输入...原创 2019-11-18 22:11:37 · 154 阅读 · 0 评论 -
机器学习笔记——统计学习方法概论(一)
机器学习什么是机器学习?机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论...原创 2019-11-15 19:40:02 · 579 阅读 · 0 评论