![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
菜菜的sklearn课堂听课笔记
文章平均质量分 95
Garcia-zhang
正处于并将长期处于码农的初级阶段
展开
-
XGBoost
XGBoost翻译 2022-07-22 19:54:18 · 1984 阅读 · 2 评论 -
朴素贝叶斯
朴素贝叶斯翻译 2022-07-21 17:28:18 · 7701 阅读 · 2 评论 -
线性回归大家族
线性回归的应用和拓展翻译 2022-07-20 18:17:37 · 876 阅读 · 0 评论 -
支持向量机SVM(下)
支持向量机下部翻译 2022-07-19 18:40:15 · 1545 阅读 · 0 评论 -
支持向量机SVM(上)
支持向量机SVM上部翻译 2022-07-18 19:02:54 · 856 阅读 · 0 评论 -
聚类算法K-Means
聚类算法K-Means翻译 2022-07-14 18:23:34 · 3722 阅读 · 0 评论 -
逻辑回归与评分卡
一、概述1.名为“回归”的分类器2.为什么需要逻辑回归3.sklearn中的逻辑回归二、linear_model.LogisticRegression2.1 二元逻辑回归的损失函数2.1.1 损失函数的概念与解惑2.1.2【选学】二元逻辑回归损失函数的数学解释,公式推导与解惑2.2 重要参数penalty & C2.2.1 正则化2.2.2 逻辑回归中的特征工程2.3 梯度下降:重要参数max_iter2.3.1 梯度下降求解逻辑回归2.3.2 梯度下降的概念与解惑2.3翻译 2022-03-16 17:17:56 · 5872 阅读 · 2 评论 -
降维算法PCA和SVD
一、概述1.维度对于数组和Series来说,维度就是功能shape返回的结果,shape中返回了几个数字,就是几维。索引以外的数据,不分行列的叫一维(此时shape返回唯一的维度上的数据个数),有行列之分叫二维(shape返回行x列),也称为表。一张表最多二维,复数的表构成了更高的维度。当一个数组中存在2张3行4列的表时,shape返回的是(更高维,行,列)。当数组中存在2组2张3行4列的表时,数据就是4维,shape返回(2,2,3,4)。数组中的每一张表,都可以是一个特征矩阵或一个DataFra翻译 2021-11-08 17:19:11 · 2285 阅读 · 0 评论 -
数据预处理和特征工程
一、概述1.数据预处理与特征工程数据挖掘的五大流程:(1).获取数据(2).数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太大或太小数据预处理的目的:让数据适应模型,匹配模型的需求(3). 特征工程:特征工程是将原始数据转换为更能代表预测模型的潜在问题的特征的过程翻译 2021-10-22 16:36:48 · 3001 阅读 · 0 评论 -
菜菜的sklearn课堂——随机森林
1.概述1.1 集成算法概述集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或分类表现。1.2 sklearn中的集成算法sklearn中的集成算法模块ensemble类类的功能ensemble.AdaBoostClassifierAdaBoost分类ensemble.AdaBoostRegressorAdaboost回归ensemble.BaggingClassifier装袋分类器ensemble.Bagg翻译 2021-09-17 16:50:56 · 2209 阅读 · 0 评论 -
菜菜的sklearn课堂——决策树
scikit-learn的官网:https://scikit-learn.org/stable/index.htmlsklearn的基本建模流程:1.实例化,建立评估模型对象(实例化时需要使用的参数)2.通过模型接口训练模型(数据模型、数据接口)3.通过模型接口提取需要的信息(数据模型、数据接口)1.概述1.1决策树是如何工作的计算全部特征的不纯度指标——>选取不纯度指标最优的特征来分枝——>在第一个特征的分枝下,计算全部特征的不纯度指标——>选取不纯度指标最优的特征继续分枝翻译 2021-08-09 10:52:19 · 1377 阅读 · 0 评论