机器学习
文章平均质量分 97
bugcode.online
路漫漫其修远兮,吾将上下而求索!
展开
-
使用Sklearn学习决策树
决策树文章目录决策树概述sklearn中的决策树sklearn的基本建模流程分类树DecisionTreeClassifier重要参数说明criterionrandom_state & splitter[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vAmwT22O-1632464362155)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]剪枝参原创 2021-09-24 14:20:00 · 19513 阅读 · 2 评论 -
使用sklearn学习多项式回归(三)
1,什么是线性我们无数次提到”线性“这个名词。在支持向量机中,我们也曾经提到最初的支持向量机只能够分割线性可分的数据,然后引入了”核函数“来帮助我们分类那些非线性可分的数据。我们也曾经说起过,比如说决策树,支持向量机是”非线性“模型。所有的这些概念,让我们对”线性“这个词非常熟悉,却又非常陌生——因为我们并不知道它的真实含义。接下来我们看看线性回归模型改进的核心之一:帮助线性回归解决非线性问题。1.1,变量之间的线性关系”线性“这个词用于描述不同事物时有着不同的含义。我们最常使用的线性是指“变量原创 2020-11-06 15:55:51 · 3807 阅读 · 0 评论 -
使用sklearn库学习线性回归(二)
1,多重共线性问题(Ridge回归和Lasso回归)1.1,什么是多重共线性我们在对多元线性回归的损失函数求导,并得出求解系数的式子和过程,在最后一步中我们需要左乘的逆矩阵,而逆矩阵存在的充分必要条件是特征矩阵不存在多重共线性。首先解释一下逆矩阵存在的充分必要条件:也就是矩阵的行列式不等于零,对于线性回归而言,即是说不能为0。这是使用最小二乘法来求解线性回归的核心条件之一。但是行列式不为零的充分必要条件是矩阵要满秩,求矩阵的秩我们一般使用行变换的方法,转换为阶梯型的矩阵,这些概念都是线...原创 2020-11-05 14:36:23 · 2550 阅读 · 0 评论 -
使用sklearn库学习线性回归(一)
1,概述1.1,判别式方法产生式模型需要计算输入输出的联合概率 需要知道(or 假定)样本的概率分布 定义似然密度的隐式参数 为没给类别搜索最大化样本似然的参数 也称为基于似然的分类(Likelihood-based Classification) 判别式模型直接构造(假定)判别式 。 判别式的显式参数(特征变量的权重)。 判别式方法 基于似然的方法关注类区域中的概率密度 基于判别式的方法只关注类区域之间的边界。 1.2,线性回归介绍回归是一种应原创 2020-11-02 12:05:35 · 11822 阅读 · 1 评论 -
使用Sklearn学习降维算法PCA和SVD
1,概述1.1,什么是维度?我们先来解释一下维度的概念。对于数组和Series来说,维度就是功能shape返回的结果,shape中返回了几个数字,就是几维。索引以外的数据,不分行列的叫一维(此时shape返回唯一的维度上的数据个数),有行列之分叫二维(shape返回行x列),也称为表。一张表最多二维,复数的表构成了更高的维度。当一个数组中存在2张3行4列的表时,shape返回的是(更高维,行,列)。当数组中存在2组2张3行4列的表时,数据就是4维,shape返回(2,2,3,4)。数组中的每原创 2020-10-24 09:26:53 · 5724 阅读 · 1 评论 -
使用Sklearn库学习数据预处理和特征工程
1,概述1.1,数据预处理和特征工程1 获取数据 2:数据预处理 数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太大或太小 数据预处理的目的:让数据适应模型,匹配模型的需求 3:特征工程 特征工程是将原始数据转换为更能代表预测模型的潜在问题的特征原创 2020-10-23 10:16:08 · 1715 阅读 · 1 评论 -
使用Sklearn学习朴素贝叶斯算法
上一篇文章我向大家介绍了朴素贝叶斯工作的理论部分,需要看的小伙伴请移步:贝叶斯分类器,接下来,我们基于Sklearn机器学习库来使用以下具体的贝叶斯分类器算法。1,sklearn中的贝叶斯分类器Sklearn基于数据分布以及这些分布上的概率估计的改进,为我们提供了四个朴素贝叶斯的分类器。类 含义 naive_bayes.BernoulliNB 伯努利分布下的朴素贝叶斯 naive_bayes.GaussianNB 高斯分布下的朴素贝叶斯 naive_bayes.Mu原创 2020-10-20 13:32:50 · 19295 阅读 · 7 评论 -
贝叶斯分类器算法原理
目录7.1,什么是朴素贝叶斯7.2,极大似然估计7.3,朴素贝叶斯分类器7.4,朴素贝叶斯算法就程7.5,朴素贝叶斯的优缺点7.1,什么是朴素贝叶斯在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法,比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数,要么是决策条件分布,但是朴素贝叶斯却是生成方法,也就是直接找出特征输出Y和特征X的联合分布,然后由得出分类的结果。贝原创 2020-10-18 18:46:47 · 5525 阅读 · 0 评论 -
机器学习概论
第一章:机器学习概论原创 2020-10-18 09:28:54 · 632 阅读 · 0 评论