sklearn
文章平均质量分 62
starter_zheng
这个作者很懒,什么都没留下…
展开
-
sklearn —— 标准化、归一化、正则化
一、标准化(Z-Score)公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:1、使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化>>> fro...转载 2018-01-31 13:23:39 · 5996 阅读 · 1 评论 -
sklearn —— 初步应用
引言:深入理解机器学习并完全看懂sklearn文档,需要较深厚的理论基础。但是,要将sklearn应用于实际的项目中,只需要对机器学习理论有一个基本的掌握,就可以直接调用其API来完成各种机器学习问题。本文选自《全栈数据之门》,将向你介绍通过三个步骤来解决具体的机器学习问题。sklearn介绍 scikit-learn是Python语言开发的机器学习库,一般简称为sklearn,目前算是...转载 2018-01-30 11:26:26 · 849 阅读 · 0 评论 -
sklearn —— GridSearchCV进行超参数优化
超参数:即不直接在估计器内学习的参数。在 scikit-learn 包中,它们作为估计器类中构造函数的参数进行传递。超参数优化:搜索超参数空间以便获得最好交叉验证分数sklearn.model_selection.GridSearchCV通过参数网格上的交叉验证网格搜索对估算器的指定参数值进行详尽搜索。常用参数列表 参数名称 参数类型 作用 e...原创 2018-02-18 17:50:09 · 3813 阅读 · 0 评论 -
sklearn —— 线性回归和逻辑回归
Linear Regression简述在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合(自变量都是一次方)。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。优点:易于理解,计算简单。缺点:对非线性...原创 2018-02-14 13:32:56 · 1364 阅读 · 0 评论