sklearn学习
smile~。
你笑起来真像好天气☆
展开
-
sklearn学习 6.聚类算法K-Means
一.概述1.无监督学习与聚类算法学习了决策树,随机森林,PCA和逻辑回归,他们虽然有着不同的功能,但却都属于“有监 督学习”的一部分,即是说,模型在训练的时候,即需要特征矩阵X,也需要真实标签y。机器学习当中,还有相当 一部分算法属于“无监督学习”,无监督的算法在训练的时候只需要特征矩阵X,不需要标签。而聚类算法,就是无监督学习的代表算法。聚类算法又叫做“无监督分类”,其目的是将数据划分成有意义或有用的组(或簇)。这种划分可以基于我们的业务 需求或建模需求来完成,也可以单纯地帮助我们探索数据的自然结构原创 2020-08-15 22:31:31 · 1522 阅读 · 0 评论 -
sklearn学习 5.降维算法PCA和SVD
一.概述**1.从什么叫“维度”说开来 **对于数组和Series来说,维度就是功能shape返回的结果,shape中返回了几个数字,就是几维。索引以外的数 据,不分行列的叫一维(此时shape返回唯一的维度上的数据个数),有行列之分叫二维(shape返回行x列),也 称为表。一张表多二维,复数的表构成了更高的维度。当一个数组中存在2张3行4列的表时,shape返回的是(更 高维,行,列)。当数组中存在2组2张3行4列的表时,数据就是4维,shape返回(2,2,3,4)。数组中的每一张表,都可以是原创 2020-08-14 21:20:00 · 357 阅读 · 0 评论 -
sklearn学习4.数据处理与特征工程
一.概述1.数据预处理与特征工程数据挖掘的五大流程:获取数据数据预处理 数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。 也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太 大或太小 数据预处理的目的:让数据适应模型,匹配模型的需求特征工程: 特征工程是将原始数据转换为更能代表预测模型的潜在问题的特征的过程,可以通过挑选最相原创 2020-08-11 22:18:14 · 513 阅读 · 0 评论 -
吴恩达机器学习作业3.2神经网络
# neural network(神经网络)import matplotlib.pyplot as pltimport numpy as npimport scipy.io as sioimport matplotlibimport scipy.optimize as optfrom sklearn.metrics import classification_report#这个包是评价报告原创 2020-08-10 22:37:11 · 269 阅读 · 0 评论 -
sklearn 3. 实例:随机森林在乳腺癌数据上的调参
。这一节,我们就来使用我们刚才学的,基于方差和偏差的调参方法,在乳腺癌数据上进行一次随 机森林的调参。乳腺癌数据是sklearn自带的分类数据之一。案例中,往往使用真实数据,为什么我们要使用sklearn自带的数据呢?因为真实数据在随机森林下的调参过程, 往往非常缓慢。真实数据量大,维度高,在使用随机森林之前需要一系列的处理,因此不太适合用来做直播中的案 例演示。在本章,我为大家准备了kaggle上下载的辨别手写数字的数据,有4W多条记录700多个左右的特征,随机 森林在这个辨别手写数字的数据上有非常好的原创 2020-08-09 21:45:39 · 638 阅读 · 0 评论 -
sklearn 3.随机森林(菜菜课程)
随机森林概述原创 2020-08-09 21:19:42 · 1023 阅读 · 0 评论 -
sklearn 2.回归树
1.回归树几乎所有参数,属性,接口都和分类树一样,只是回归树里没有标签分布是否均衡的问题2.参数:criterion回归树衡量分枝质量的指标,支持的标准有三种:1) 输入"mse"使用均方误差mean squared error(MSE),父节点和叶子节点之间的均方误差的差额被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化损失2)输入"friedman_mse"使用费尔德曼均方误差,这种指标是用费里德曼对潜在分支中的问题改进后的均方误差3)输入 "mae"使用绝对平均误差MAE(m原创 2020-08-01 14:19:17 · 961 阅读 · 0 评论 -
scikit-klearn之 1.决策树
一.决策树概述1.认识决策树决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种集成算法,在各个行业和领域都有广泛的应用。2.理解决策树如何工作决策树算法的本质是一种图结构,我们只需要问一系列问题就可以对数据进行分类了举例,如下列数据集,一系列已知物种以及所属类别的数据我们现在的目标是原创 2020-07-29 09:56:50 · 550 阅读 · 0 评论