![](https://img-blog.csdnimg.cn/20201109190018449.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
ML-Arithmetic-Learning
主要用来记录我的ML学习历程。
BigPanl
这个作者很懒,什么都没留下…
展开
-
如何对Pipeline中的参数进行交叉验证网格搜索
1. GridSearchCV在常规estimator下的使用在大多数情况下我们使用交叉验证网格搜索(GridSearchCV)都是对特定的一个模型评估器(estimator)对象的超参数进行网格搜索来寻找最优的参数值。正常estimator进行网格搜索的使用方式如下:下面使用鸢尾花数据集进行测试分析。sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None)对估计器的指定参数值进行详尽搜索estimator:原创 2020-11-21 19:57:59 · 591 阅读 · 0 评论 -
多项式回归下的过拟合和欠拟合原理解释
过拟合和欠拟合(overfitting and underfitting)过拟合(overfitting)就是对训练数据集的拟合很好,但是对测试数据集的拟合能力就变的很差,模型过多的表达了数据间的噪音关系,此时模型的泛化能力就很差。欠拟合(underfitting)指的是算法训练的模型不饿能完整的表述数据这之间的关系。下面通过一个多项式回归的例子来感性的认识这两个概念:Step1 随机生成一组具有非线性关系的数据集合import numpy as npimport matplotlib.pypl原创 2020-11-16 23:30:40 · 2894 阅读 · 1 评论 -
Sklearn-特征预处理Preprocessing
为什么要进行特征预处理(Preprocessing data)一句经典语录:“Garbage in,garbage out”。如果输入的数据没有进行很好的处理,那么即使经过训练也不会有好的结果。Sklearn中讲到In general, learning algorithms benefit from standardization of the data set. If some outliers are present in the set, robust scalers or transf原创 2020-11-15 10:48:11 · 284 阅读 · 0 评论 -
多元线性回归-正规方程解的实现
import numpy as npfrom sklearn import datasetsboston = datasets.load_boston()X = boston.datay = boston.targetX = X[y<50.0]y = y[y<50.0]X.shape (490, 13)y.shape(490,)使用自己实现的LinearRegression进行多元线性回归房价预测from playML.model_selection impo原创 2020-11-09 19:07:45 · 266 阅读 · 0 评论