sklearn
sklearn
_illusion_
知乎主页:https://www.zhihu.com/people/illusions-29/posts
展开
-
sklearn提供的Logistic Regression库中各个参数的含义详解
转载地址:https://blog.csdn.net/CherDW/article/details/54891073 逻辑回归:可以做概率预测,也可用于分类,仅能用于线性问题。通过计算真实值与预测值的概率,然后变换成损失函数,求损失函数最小值来计算模型参...转载 2018-09-08 09:40:47 · 28469 阅读 · 7 评论 -
sklearn.preprocessing之StandardScaler与Normalizer
一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。123456789101...转载 2018-09-28 01:43:43 · 2108 阅读 · 0 评论 -
sklearn之Cross-validation、GridSearchCV,以及训练集(train)、测试集(test)、验证集(validate)的辨析
1.训练集(train)、测试集(test)、验证集(validate)对于初学者而言,训练集、测试集、验证集这三个词可能会让你很迷糊,特别是后两者。这里我尽量用简单的话说一下我自己的理解,希望可以讲明白: 对于机器学习模型训练而言,一般是分为训练集和测试集的。训练集有input(X)和label(y),测试集只有input(X),它的label是要测试集训练好的模型去预测的...原创 2018-09-29 00:41:15 · 15104 阅读 · 6 评论 -
sklearn中Pipeline的使用方法
转载自https://www.jianshu.com/p/9c2c8c8ef42d Pipeline可以将许多算法模型串联起来,比如将特征提取、归一化、分类组织在一起形成一个典型的机器学习问题工作流。主要带来两点好处:直接调用fit和predict方法来对pipeline中的所有算法模型进行训练和预测。 可以结合grid search对参数进行选择。在下面的例子中,我们使用决策树模...转载 2018-10-17 01:35:35 · 22873 阅读 · 0 评论