机器学习
文章平均质量分 89
ㄣ知冷煖★
CSDN人工智能领域优质创作者、阿里云专家博主、腾讯云开发者内容共创官、百林哲教育专家、全国3D建模大赛国奖获得者、省奖若干、Kaggle竞赛银牌若干、BPAA算法大赛模型鉴赏师、在职算法工程师,计算机硕士。
展开
-
工业蒸汽预测
本文来自于天池大赛——学习赛,仅作学习使用,目标:给定经过脱敏后的锅炉传感器采集的数据,根据锅炉的工况来预测产生的蒸汽量。原创 2022-09-26 14:06:47 · 1578 阅读 · 1 评论 -
MindOpt有关于Python的建模与优化
周四,天气渐渐凉快了下来。原创 2022-08-25 17:55:44 · 712 阅读 · 0 评论 -
HyperGBM开源工程介绍
HyperGBM是一款全Pipeline自动机器学习工具,可以端到端的完整覆盖从数据清洗、预处理、特征加工和筛选以及模型选择和超参数优化的全过程,是一个真正的结构化数据AutoML工具包。原创 2022-08-24 18:15:16 · 1126 阅读 · 0 评论 -
特征生成(特征创建)
数据决定了模型效果的上限,使用复杂模型只能逼近上限!原创 2022-08-22 14:13:47 · 1506 阅读 · 0 评论 -
sklearn.model_selection.learning_curve介绍(评估多大的样本量用于训练才能达到最佳效果)
学习曲线函数:可以用于检验数据是否过拟合,并且可以评估多大的样本量用于训练才能达到最佳效果(了解数据如何影响模型的性能)。还可以用于测试模型的超参数。learning_curve函数介绍: 用于确定不同训练集大小的交叉验证训练和测试分数,交叉验证生成器在训练和测试数据中对整个数据集进行k次拆分。将使用具有不同大小的训练集的子集来训练估计器,并将计算每个训练子集大小的分数和测试集。之后,将对每个训练子集大小的所有k次运行的分数求平均。...原创 2022-08-18 16:10:26 · 912 阅读 · 0 评论 -
BOX-COX变换介绍
通常情况下,我们拿到的数据并不是正态分布的,为了满足经典线性模型的正态性假设,常常需要使用1、指数变换2、对数转化3、倒数转换4、平方根后取倒数5、平方根后再取反正弦使其转换后的数据接近正态,Box-Cox变换可以使线性回归模型在满足线性、正态性、独立性以及方差齐性的同时,又不丢失信息。变换后有利于线性模型的拟合以及分析出特征的相关性。天又黑了,看起来要下雨的样子。...原创 2022-08-16 14:30:18 · 6727 阅读 · 0 评论 -
数据分析可视化常用图介绍以及相关代码实现(箱型图、Q-Q图、Kde图、线性回归图、热力图)
爱意随风起,风止意难平。原创 2022-08-16 10:43:43 · 4781 阅读 · 0 评论 -
【线性回归】线性回归的详细介绍&代码完全实现
早上没睡醒!又是在梦中被坏女人骗走感情的一天。原创 2022-08-10 16:21:09 · 7519 阅读 · 0 评论 -
SVM介绍以及实战
在龙岗的时候就在想着什么时候学习SVM了,回想起来好像已经过了很久很久了!SVM介绍SVM,全称是supportvertormachine,直译过来是支持向量机,属于监督学习算法。原理支持向量机是一个线性分类器,其定义在于找到一个界限,使得两边的样本都离这个界限足够远。这个界限被称之为超平面。超平面一般是直线或者是平面。在SVM中,样本点距离直线的距离,代表着样本分类的可信程度。最好的情况对于SVM来说,最好的分类情况是,超平面对每个类别最近的元素距离最远。优点劣势https。...原创 2022-08-01 19:03:02 · 2166 阅读 · 0 评论 -
网格搜索的原理以及实战以及相关API(GridSearchCV)
网格搜索是调参侠常用的一种调参手段原创 2022-02-11 19:20:30 · 5015 阅读 · 0 评论 -
数据分析必学技能:混淆矩阵原理详解,Python调用实战
目录前言一、原理详解二、混淆矩阵的相关API介绍以及样例总结前言混淆矩阵用来评估分类的准确性。一、原理详解混淆矩阵:混淆矩阵是将真实值与预测值匹配以及不匹配的项一起放入到矩阵中,它可以清楚的反映出真实值和预测值相同的地方,也可以反映出与预测值不相同的地方,举一个多分类的例子。原创 2022-02-11 17:01:39 · 5838 阅读 · 0 评论 -
逻辑回归(Logistic Regression)详解
逻辑回归详解前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as npimpor原创 2021-12-30 15:39:38 · 4415 阅读 · 4 评论 -
K折交叉验证的原理以及实战&使用StratifiedKFold来实现分层抽样
目录前言一、交叉验证(Cross-Validation)1-1、LOOCV(Leave-One-Out Cross Validation)1-2、K-fold Cross Validation1-3、k的选取二、K折交叉验证实战。总结前言交叉验证的由来:在机器学习的过程中,我们不能将全部数据都用于数据的模型训练,否则会导致我们没有数据集对该模型进行验证,无法评估模型的预测效果。一、交叉验证(Cross-Validation)众所周知,模型训练的数据量越大时,通常训练出来的模型效果会越好,所以如何原创 2021-12-01 13:56:21 · 5308 阅读 · 0 评论 -
从RMSE和MSE到更多选择:探索机器学习模型性能指标
目录前言一、RMSE(Root Mean Square Error)均方根误差二、MSE(Mean Square Error)均方误差三、总结前言这是一篇平平无奇的学习笔记一、RMSE(Root Mean Square Error)均方根误差rmse:真实值与差值的平方然后求和再平均,最后开根号。MSE=1m∑i=1m(yi−f(xi))2MSE = \sqrt{\frac1m\sum_{i=1}^m{(y_i-f(x_i))}^2}MSE=m1i=1∑m(yi−f(xi))2二、原创 2021-11-27 11:03:16 · 26659 阅读 · 0 评论 -
fit、transform、fit_transform的区别和联系
fit、transform、fit_transform的区别和联系一、fit、transform、fit_transform的区别和联系?二、注意事项一、fit、transform、fit_transform的区别和联系?1、fit(): fit的作用就是求得训练集的均值、方差、最大值、最小值等。2、transform(): transform的作用是在fit的基础上,进行标准化,降维,归一化等操作。3、fit_transform(): 是fit和transform的结合,既包括了训练又包含了转换。原创 2021-09-20 12:51:13 · 2066 阅读 · 0 评论 -
机器学习基础知识
机器学习基础知识一、树形结构为什么不需要归一化?二、请详细说说支持向量机(SVM)的原理?三、逻辑斯特回归为什么要对特征进行离散化?四、overfitting怎么解决?五、说说梯度下降法?六、为什么xgboost要用泰勒展开,优势在哪里?七、谈谈判别式模型和生成式模型?八、请详细说说EM算法?九、机器学习中,为何要经常对数据做归一化?十、简单说说贝叶斯定理?十一、如何进行特征选择?十二、机器学习和统计里面的auc的物理意义是什么?十三、常见的分类算法有哪些?他们各自的优缺点是什么?十四、RF与GBDT之间的原创 2021-08-01 11:52:34 · 670 阅读 · 0 评论