![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
机器学习基础
赵小刀的小锦囊
一个想成为很厉害的数学分析师的小透明。
展开
-
Ensemble Learning——随机森林\极限森林\梯度提升树\GBDT
文章目录随机森林极限森林算法 API`class sklearn.ensemble.ExtraTreesClassifier(n_estimators=100, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1)`随机森林极限森林算法 APIclass sklearn.ensemble.Ext...原创 2020-05-23 23:42:27 · 1401 阅读 · 0 评论 -
天池工业蒸汽量预测代码及详解
文章目录1、赛题介绍2、数据梳理3、建模过程4、总结1、赛题介绍赛题背景火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。赛题描述经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),原创 2020-05-15 14:42:04 · 2791 阅读 · 1 评论 -
机器学习——非监督算法(聚类分析)
文章目录1.核心思想2.聚类算法 API3.案例分析4.优缺点分析1.核心思想1.聚类算法中有超参数 K,理解为将数据划分为几个类别,一般现实实现时,知道划分类别的个数。例 K=3 时2.随机在数据当中抽取 3个样本,当做三个类别的中心点(k1,k2,k3)3.计算其余的点分别到这三个中心店的距离,每一个样本有三个距离(a,b,c),对每一个样本从(k1,k2,k3)中间选出距...原创 2020-04-15 13:59:08 · 1409 阅读 · 0 评论 -
机器学习——回归算法
文章目录一、线性回归算法核心思想LR 算法 API案例分析优缺点分析岭回归Ridge算法API正则化力度案例分析二、逻辑回归算法一、线性回归算法核心思想LR 算法 API 正规方程sklearn.linear_model.LinearRegression()最小二乘法线性回归- 返回参数:coef_ 回归系数 梯度下降sklearn.linear_model.SGDReg...原创 2020-04-13 16:58:23 · 543 阅读 · 1 评论 -
机器学习—分类算法(KNN、Bayes、Tree、RandomForest算法详解)
文章目录一、机器学习简述机器学习算法分类机器学习开发流程二、数据划分、转换器、估计器sklearn 内置数据集数据集进行分割转换器与预估器三、K-近邻算法(KNN)核心思想KNN 算法 API案例分析优缺点分析一、机器学习简述机器学习算法分类监督学习(预测):数据集有特征值+目标值分类(目标值离散型)——K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络回归(目标值连续型)...原创 2020-04-11 12:34:45 · 1240 阅读 · 1 评论 -
机器学习—数据的特征工程
文章目录一、数据的特征工程1.字典的特征抽取①语法②流程③案例④One-hot 编码2.文本特征抽取1)Count 方法①语法②流程③案例④特殊规则⑤jieba.cut 分词处理器2)Tf/Idf方法① 语法② 流程③ 案例3.数据的特征预处理1)处理方法2)归一化① 语法② 流程③ 案例3)标准化① 语法② 流程③ 案例① 语法② 流程③ 案例二、模型、策略、优化三、分类、回归和聚类四、Tens...原创 2020-04-09 15:17:33 · 570 阅读 · 0 评论