Python算法练习(十二)// 算法:SVM vs Adaboost vs 逻辑回归,数据集:澳大利亚weather

该博客介绍了在澳大利亚weather数据集上,使用Python进行算法实践,包括数据预处理、SVC、Adaboost和逻辑回归模型的构建与评估。通过练习,强调了特征工程的重要性,指出数据清洗时处理缺失值和异常值的策略。结果显示,逻辑回归在准确率、召回率和ROC值上表现最佳。
摘要由CSDN通过智能技术生成

一、练习目标:
1、数据清洗及预处理,掌握分类特征及标签的编码方法,包括OrdinalEncoder、OneHotEncoder、LabelEncoder。
2、通过练习,重点掌握SVC算法、Adaboost算法的调参,重点掌握提高召回率的调参办法。
3、比较不同算法建立分类模型的运行时间、准确率、召回率、ROC值。

二、重要结论:
1、存在严重缺失值问题。(特征工程多么重要!!本次练习重点在算法理解,故暴力处理,直接删除有缺失值样本)
2、存在不太明显的异常值问题。(Rainfall当作分类特征处理)(直接删除有异常值的样本)
3、存在特征量纲差异问题,对13个连续型特征进行标准化处理。
4、对5万多条样本量与120个特征的数据集建模,不同算法的表现如下:

**(1)运行效率排名**
 - SVM(SVC)算法 (3-18分钟)< Adaboost算法 < 逻辑回归算法。
 - SVM(SVC)算法中,比较基于四个核函数建模的运行时间,取linear时最长,取rbf时最短。
**(2)追求最高准确率**
 - Adaboost算法表现最差,SVM(SVC)算法与逻辑回归算法表现相当
 - SVM(SVC)算法中,linear与rbf表现相当
**(3)追求最高召回率**
 - SVM(SVC)算法 与 逻辑回归算法 表现相当,逻辑回归算法略好。

5、不论哪个算法,若追求最高召回率,同时明显牺牲了准确率。
6、综合来看&#x

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值