机器学习
文章平均质量分 92
为什么昵称不能重复
这个作者很懒,什么都没留下…
展开
-
【机器学习】常用算法特点总结
算法名称适用的问题损失函数学习策略参数求解 / 调参方法线性回归回归问题感知机分类问题逻辑回归决策树(ID3)决策树(C4.5)决策树(CART)支持向量机朴素贝叶斯KmeansK近邻Adaboost神经网络EM算法...原创 2021-02-15 20:56:08 · 318 阅读 · 0 评论 -
【机器学习】Adaboost多类分类——SAMME算法,SAMME.R算法
前言根据Adaboost算法更新权重的原理我们知道想要在下一轮训练中使误分类的样本的权重增加,每一轮训练的错误率都必须小于0.5,包括初始化分类器时也是如此。初始化一般都是随机初始化,对于二分类任务,每个样本都有0.5的概率被预测正确,要达到0.5以上的正确率还是比较容易的,但是对于多分类问题就不一样了,在多分类问题中如果有KKK个不同的类别,那么随机猜测只有 1/K1/K1/K 的概率预测正确,因此若直接将Adaboost算法应用于多类分类问题并不能得到令人满意的结果。针对这个问题,Zhu Ji等人在2原创 2020-12-14 15:26:18 · 10352 阅读 · 6 评论 -
P-R曲线绘制原理及代码实现
简介P-R曲线,是指以查准率(亦称准确率)为纵轴、查全率(亦称召回率)为横轴画出的曲线,反映了查准率随查全率的变化趋势,在机器学习中常用于二分类模型的评价及选择。相关概念混淆矩阵实际为负实际为正预测为负TNFP预测为正FNTP查准率(亦称准确率)precision=TPTP+FPprecision = \frac{TP}{TP+FP}precision=TP+FPTP查全率(亦称召回率)recall=TPTP+FNrecall = \frac{TP}原创 2020-12-05 22:10:46 · 8761 阅读 · 1 评论 -
ROC曲线绘制原理详解
简介ROC曲线,全称为receiver operating characteristic curve,即接收者操作特征曲线,反映了真阳性率(TPR)随假阳性率(FPR)的变化趋势,在机器学习中常用于二分类模型的评价及选择。原创 2020-09-18 21:44:35 · 4177 阅读 · 0 评论 -
【sklearn】GridSearchCV辅助Pipeline调参
实例波士顿房价的预测。数据集是统计的 20 世纪 70 年代中期波士顿郊区房价的中位数,来源即sklearn.dataset.load_boston()。该例分析流程:生成特征多项式、数据归一化、构建岭回归模型,并将这三步封装到Pipeline中用 GridSearchCV,对 Pipeline中 PolynomialFeatures的 degree参数和岭回归模型的alpha参数进行调优用训练集进行模型拟合用训练好的模型对测试集的预测准确度进行评估,评估指标采用R2_score通过上面对原创 2020-07-10 16:43:45 · 727 阅读 · 0 评论 -
【机器学习】关联规则及python实现
简介关联规则是一种在大型数据库中发现变量之间的有趣性关系的方法。它的目的是利用一些有趣的度量来识别数据库中的强规则。数学定义:假设I={I1,I2,…,Im}{\displaystyle I=\{I_{1},I_{2},\ldots ,I_{m}\}}I={I1,I2,…,Im}是项的集合。给定一个交易数据库D={t1,t2,…,tn}{\displaystyle D=\{t_{1},t_{2},\ldots ,t_{n}\}}D={t1,t2,…,tn},其中每个事务(Transactio原创 2020-11-12 20:49:11 · 1394 阅读 · 0 评论 -
【机器学习】Xgboost的使用及参数详解
Xgboost的原生库#mermaid-svg-2QkQMijIkIAMOWxw .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-2QkQMijIkIAMOWxw .label text{fill:#333}#mermaid-svg-2QkQMijIkIAMOWxw .node rect,#mermaid-sv原创 2020-11-16 15:58:46 · 21026 阅读 · 3 评论