《菜菜的机器学习 sklearn 课堂》
文章平均质量分 87
浅尝辄止。。
萌宅鹿同学
目前就读于江苏大学,热爱技术。
展开
-
《菜菜的机器学习sklearn课堂》学习笔记 + 课件
《菜菜的机器学习sklearn课堂》sklearn入门与决策树随机森林应用泛化误差调参实例原创 2021-02-25 13:03:47 · 14185 阅读 · 57 评论 -
《菜菜的机器学习sklearn课堂》聚类算法Kmeans
聚类算法无监督学习与聚类算法无监督学习与聚类算法我们已经学习了决策树,随机森林,逻辑回归,他们虽然有着不同的功能,但却都属于 有监督学习 的一部分,即是说:模型在训练的时候,既需要特征矩阵X,也需要真实标签y。机器学习当中,还有相当一部分算法属于 无监督学习,无监督的算法在训练的时候只需要特征矩阵X,不需要标签。我们曾经学过的PCA降维算法就是无监督学习中的一种。聚类算法,也是无监督学习的代表算法之一。聚类算法又叫做“无监督分类”,其目的是将数据划分成有意义或有用的组(或簇)。这种划分可以基于我们的原创 2021-02-24 14:12:25 · 1632 阅读 · 0 评论 -
《菜菜的机器学习sklearn课堂》逻辑回归
逻辑回归概述:名为“回归”的分类器为什么需要逻辑回归?sklearn中的逻辑回归概述:名为“回归”的分类器我们已经接触了不少带 “回归” 二字的算法,例如回归树、随机森林的回归,他们都是区别于分类算法,用来处理和预测连续型标签的算法。然而逻辑回归是一种名为“回归”的线性分类器,其本质是由线性回归变化而来的,一种广泛使用于分类问题中的广义回归算法。要理解逻辑回归从何而来,得先理解线性回归。线性回归是机器学习中最简单的的回归算法:z=θ0+θ1x1+θ2x2+...+θnxnz = \theta_0原创 2021-02-22 23:08:37 · 1225 阅读 · 0 评论 -
《菜菜的机器学习sklearn课堂》降维算法PCA和SVD
降维算法PCA和SVD什么是维度sklearn中的降维算法PCA 与 SVD降维究竟是怎样实现的?重要参数 n_components什么是维度对于数组和Series来说,维度就是方法shape返回的结果。索引以外的数据:不分行列的叫一维(shape返回唯一的维度上的数据个数)有行列之分叫二维(shape返回行x列),也称为表一张非复数的表最多二维,复数的表可以构成更高的维度当一个数组中存在2张3行4列的表时,shape返回的是(2, 3, 4)当数组中存在2组2张3行4列的表时,数据就是4原创 2021-02-21 01:25:23 · 1018 阅读 · 0 评论 -
《菜菜的机器学习sklearn课堂》数据预处理和特征工程
数据预处理和特征工程数据预处理和特征工程 - 概述数据预处理 Preprocessing & Impute数据无量纲化数据归一化 preprocessing.MinMaxScaler数据标准化 preprocessing.StandardScalerStandardScaler 和 MinMaxScaler 如何选择?缺失值缺失值填补 impute.SimpleImputer处理分类型特征:编码与哑变量preprocessing.LabelEncoder 标签专用,将分类转换为分类数值prepro原创 2021-02-12 22:46:51 · 2020 阅读 · 1 评论 -
《菜菜的机器学习sklearn课堂》随机森林应用泛化误差调参实例
随机森林原创 2021-02-12 02:15:38 · 4276 阅读 · 5 评论 -
《菜菜的机器学习sklearn课堂》sklearn入门与决策树
决策树sklearn简介决策树 - 概述决策树是如何工作的sklearn中的决策树DecisionTreeClassifier重要参数criterion建立一颗树(只有一个参数)random_state、splitter剪枝参数目标权重参数重要属性 feature_importances_常用接口 fit、score、apply、predict实例:分类树在合成数集上的表现课程要求的配置如下,但是环境只要 >= 它即可。Python 3.7.1Scikit-learn 0.20.0Graph原创 2021-02-10 23:07:10 · 5016 阅读 · 2 评论