菜菜sklearn
R戎
这个作者很懒,什么都没留下…
展开
-
skelearn 决策树及参数详解(分类一),实现红酒数据集分类
sklearn 中的决策树1、sklearn中决策树的类都在”tree“这个模块之下。这个模块总共包含五个类:2、sklearn建模的基本流程这个流程中分类树对应的代码from sklearn import tree #导入需要的模块clf = tree.DecisionTreeClassifier() #实例化clf = clf.fit(X_train,y_train) #用训练...原创 2019-04-11 15:01:34 · 7366 阅读 · 5 评论 -
sklearn决策树回归树详解,及波士顿房价预测,正弦曲线预测,及交叉验证实现
DecisionTreeRegressorclass sklearn.tree.DecisionTreeRegressor (criterion=’mse’, splitter=’best’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=No...原创 2019-04-11 17:57:36 · 5586 阅读 · 0 评论 -
决策树sklearn实现泰坦尼克号幸存者的预测 及决策树优缺点、参数、属性、接口总结
泰坦尼克号的沉没是世界上最严重的海难事故之一,今天我们通过分类树模型来预测一下哪些人可能成为幸存者。数据集来自https://www.kaggle.com/c/titanic,数据集包含两个csv格式文件,data为我们接下来要使用的数据,test为kaggle提供的测试集。接下来我们就来执行我们的代码。1. 导入所需要的库import pandas as pdfrom sklearn....原创 2019-04-12 10:05:43 · 2794 阅读 · 1 评论 -
sklearn随机森林-分类参数详解
sklearn中的集成算法1、sklearn中的集成算法模块ensembleensemble.AdaBoostClassifier : AdaBoost分类ensemble.AdaBoostRegressor :Adaboost回归ensemble.BaggingClassifier :装袋分类器ensemble.BaggingRegressor :装袋回归器ensem...原创 2019-04-12 20:58:04 · 39379 阅读 · 5 评论 -
sklearn逻辑回归参数详解,及用逻辑回归制作评分卡
1 导库,获取数据%matplotlib inlineimport numpy as npimport pandas as pdfrom sklearn.linear_model import LogisticRegression as LR#其实日常在导库的时候,并不是一次性能够知道我们要用的所有库的。通常都是在建模过程中逐渐导入需要的库。data = pd.read_csv(r"...原创 2019-04-16 11:11:18 · 4601 阅读 · 7 评论 -
sklearn 随机森林参数属性接口及 在乳腺癌数据上的调参
1. 导入需要的库from sklearn.datasets import load_breast_cancerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import cross...原创 2019-04-14 22:12:33 · 1018 阅读 · 0 评论 -
sklearn 数据处理与特征工程
1、数据处理的流程2 数据预处理 Preprocessing & Impute2.1 数据无量纲化在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无...原创 2019-04-14 23:00:16 · 1964 阅读 · 1 评论