sklearn
文章平均质量分 96
扔出去的回旋镖
真是无力又着迷
展开
-
ccc-sklearn-1-决策树
sklearn.tree模块中的类、sklearn基本建模流程、决策树的criterion参数、python构造一课决策树(红酒分类)、决策树中的其他参数、重要的属性和接口、回归树的criterion参数、交叉验证、一维回归图像的绘制、泰坦尼克幸存者预测(网格搜索)原创 2022-09-23 19:51:43 · 673 阅读 · 0 评论 -
ccc-sklearn-2-随机森林
集成算法概述、集成算法模块ensemble、RandomForestClassifier参数、bootstrap & oob_score、随机森林的建立的流程、重要接口和属性、使用Bagging的一个必要条件、随机森林回归API、随机森林回归填充缺失值实例、机器学习中的调参基本思想、随机森林在乳腺癌数据上的调参原创 2022-09-26 19:59:06 · 970 阅读 · 0 评论 -
ccc-sklearn-3-特征工程
特征工程基本概念、数据无量纲化 、缺失值的处理、处理分类型特征:编码与哑变量、处理连续型数据:二值化与分箱、特征选择 feature_selection、方差过滤、方差过滤对于模型的影响、KNN过滤、卡方过滤、F检验-ANOVA、互信息法、Embedded嵌入法、Wrapper包装法原创 2022-09-29 22:33:18 · 569 阅读 · 0 评论 -
ccc-sklearn-4-特征降维
维度的概念、PCA与SVD、重要参数n_components与实际可视化案例、人脸识别案例与手写字识别噪音过滤、PCA实现784个特征的手写字降维、PCA参数列表、属性列表、接口列表原创 2022-10-04 09:08:46 · 383 阅读 · 0 评论 -
ccc-sklearn-5-逻辑回归
逻辑回归概述、Sigmoid函数、.sklearn中的逻辑回归、二元逻辑回归损失函数的数学解释,公式推导、L1与L2正则化曲线实例、逻辑回归中的特征工程、梯度下降、银行评分卡实例原创 2022-10-12 19:43:56 · 1049 阅读 · 0 评论 -
ccc-sklearn-6-K-means
K-Means概述、无监督学习与聚类算法、sklearn中的聚类算法、KMeans如何工作、聚类算法的模型评估指标、通过轮廓系数找最佳n_clusters、KMeans的矢量量化应用原创 2022-10-16 19:43:46 · 358 阅读 · 0 评论 -
ccc-sklearn-7-SVM(1)
SVM概述、线性SVM用于分类的原理、线性SVM决策过程的可视化、非线性数据集建模的方式原创 2022-10-20 19:55:21 · 339 阅读 · 0 评论 -
ccc-sklearn-8-SVM(2)
SVM重要参数kernel、SVM重要参数kernel、sklearn中的四种核函数、探索核函数在不同数据集上的表现、探索核函数的优势和缺陷、参数C、引入C的方式、学习曲线调整C的值原创 2022-10-24 17:11:25 · 739 阅读 · 0 评论 -
ccc-sklearn-9-SVM(3)
引入参数C后的支持向量、观察不同数据集分类的支持向量、SVC重要参数class_weight、SVC的参数:class_weight、分别绘制进行了数据平衡与未数据平衡数据的决策边界、SVC的模型评估指标混淆矩阵、SVM实现概率预测、sklearn中绘制、利用ROC曲线找到最佳阈值ROC曲线和AUC面积原创 2022-10-28 21:23:47 · 803 阅读 · 0 评论 -
ccc-sklearn-10-SVM(4)
SVC处理多分类问题:参数decision_function_shape、SVC重要属性、SVC真实案例:预测明天是否降雨、SVC总结原创 2022-11-01 21:56:56 · 616 阅读 · 0 评论 -
ccc-sklearn-11-线性回归(1)
sklearn中的线性回归、多元线性回归LinearRegression、简单的一次回归实验、岭回归与Lasso、多重共线性、Lasso 与多重共线性、Lasso选取最佳的正则化化参数取值原创 2022-12-27 14:12:39 · 597 阅读 · 4 评论 -
ccc-sklearn-12-线性回归(2)
非线性问题:多项式回归、建立一个明显非线性数据观察线性回归和决策树在拟合时的表现、使用分箱处理非线性问题、箱子数量对于模型结果的影响以及选取最优箱子数、多项式回归PolynomialFeatures、多项式回归处理非线性问题、多项式是线性还是非线性模型原创 2023-01-03 22:38:39 · 249 阅读 · 0 评论 -
ccc-sklearn-13-朴素贝叶斯(1)
sklearn中的朴素贝叶斯、高斯朴素贝叶斯、探索朴素贝叶斯的拟合效果与运算速度、概率类模型的评估指标、布里尔分数Brier Score、探索手写数据集上逻辑回归,SVC和高斯朴素贝叶斯的效果、对数似然函数Log Loss、可靠性曲线 Reliability Curve、校准可靠性曲线原创 2023-01-06 22:08:23 · 445 阅读 · 4 评论 -
ccc-sklearn-14-朴素贝叶斯(2)
MultinomialNB多项式贝叶斯、BernoulliNB伯努利朴素贝叶斯、ComplementNB补集朴素贝叶斯、案例:贝叶斯做文本分类原创 2023-01-09 00:10:29 · 539 阅读 · 0 评论 -
ccc-sklearn-15-XGBoost(1)
XGBoost集成算法介绍、梯度提升树-集成算法、XGBoost的三大板块、参数n_estimators、参数subsample、参数eta原创 2023-01-10 23:16:35 · 367 阅读 · 0 评论 -
ccc-sklearn-16-XGBoost(2)
XGBoost的其他参数、选择弱评估器:参数booster、XGB的目标函数:参数objective、XGB目标函数的求解、参数化决策树 :参数alpha,lambda、寻找最佳树结构:求解w和T、寻找最佳分枝:结构分数之差、让树停止生长:重要参数gamma原创 2023-01-19 21:55:49 · 463 阅读 · 1 评论 -
ccc-sklearn-17-XGBoost(3)
XGBoost的应用中的问题、过拟合:剪枝参数与回归模型调参、默认参数下交叉验证曲线、通过剪枝与对比来展示参数调节的结果、XGBoost模型的保存与调用(pickle、joblib)、XGBoost中样本不均衡的问题、XGBoost类中其他功能以及参数原创 2023-02-01 18:44:15 · 334 阅读 · 0 评论