自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据预处理1 Preprocessing & Impute

数据预处理1 Preprocessing & Impute 1、数据无量纲化 ​ 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无量纲化可以帮我们提升模型精度,避免某一个取值范围特别大的特征对距离计算造成影响。 ​ 数据的无量纲化可以是线性的,也可以是非线性的。

2021-07-14 11:55:14 289 2

原创 随机森林调参思想在乳腺癌上的应用

随机森林调参思想在乳腺癌上的应用 1、需要导入的库 from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import GridSearchCV from sklearn.model_selection import cross_val_score import matplotlib.pyplot as p

2021-07-07 18:10:07 154

原创 sklearn中随机森林调参的思想

随机森林学习中调参的思想 ​ 在机器学习中,我们用来衡量模型在未知数据上的准确率的指标,叫做泛化误差(Genelization error)。 泛化误差 ​ 当模型在未知数据(测试集或者袋外数据)上表现糟糕时,我们说模型的泛化程度不够,泛化误差大,模型的效果不好。泛化误差受到模型的结构(复杂度)影响。当模型太复杂,模型就会过拟合,泛化能力就不够,所以泛化误差大。当模型太简单,模型就会欠拟合,拟合能力就不够,所以误差也会大。只有当模型的复杂度刚刚好的才能够达到泛化误差最小的目标。 那模型的复杂度与我们的

2021-07-07 17:33:24 180

原创 sklearn入门——决策树在sklearn中的实现_实例2

sklearn入门——决策树在sklearn中的实现_实例2 1、 导入所需要的库 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.model_selection import GridSearchCV from sklearn.model_selection import cross_va

2021-07-04 16:45:19 247

原创 sklearn入门——回归决策树在sklearn中的实现_实例演示1

sklearn入门——回归决策树在sklearn中的实现_实例演示1 1、回归树的简介 ​ 在回归树中,几乎所有的参数都与分类树一模一样。回归树函数的参数如下: class sklearn.tree.DecisionTreeRegressor (criterion=’mse’, splitter=’best’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features

2021-07-02 10:12:11 561

原创 sklearn入门——决策树在sklearn中的实现

sklearn入门——决策树在sklearn中的实现 1、决策树的简介 ​ 决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。在这个决策过程中,我们一直在对记录的特征进行提问。最初的问题所在的地方叫做根节点,在得到结 论前的每一个问题都是中间节点,而得到的每一个结论(动物的类别)都叫做叶子节点。 ​ 例如说我们对新物种python,它是冷血动物,体表带鳞片,并且不是胎生,我们就可以通过

2021-06-30 22:05:28 627 6

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除