机器学习实战之AdaBoost元算法（三）示例：在一个难数据集上应用AdaBoost

琼简

于 2020-12-01 10:53:16 发布

阅读量487

点赞数

文章标签：算法 python 机器学习人工智能

本文链接：https://blog.csdn.net/weixin_45814668/article/details/107388622

版权

本文介绍了如何在Python环境下应用AdaBoost元算法处理难数据集。通过自适应数据加载函数，训练并测试算法，分析了过拟合现象。在数据预处理、训练和测试过程中，展示了AdaBoost在分类问题中的应用。

摘要由CSDN通过智能技术生成

转载请注明作者和出处：https://blog.csdn.net/weixin_45814668
知乎：https://www.zhihu.com/people/qiongjian0427
Git：https://github.com/qiongjian/Machine-learning/
运行环境：anaconda—jupyter notebook
Python版本： Python3.x

更多精彩内容，尽在微信公众号，欢迎您的关注：
在这里插入图片描述

步骤

(1)收集数据：提供的文本文件。
将Logistic（四）的数据horseColicTraining和horseColicTest.txt文件拷贝到代码所在的文件夹中，把数据集的标签改为+1和-1，其他数据不变。
(2)准备数据：确保类别标签是+1和-1而非1和0。
(3)分析数据：手工检查数据。
(4)训练算法：在数据上，利用adaBoostTrainDS()函数训练出一系列的分类器。
(5)测试算法：我们拥有两个数据集。在不釆用随机抽样的方法下，我们就会对AdaBoost和Logistic回归的结果进行完全对等的比较。
(6)使用算法：观察该例子上的错误率。不过，也可以构建一个Web网站，让驯马师输入马的症状然后预测马是否会死去。

自适应数据加载函数

最低0.47元/天解锁文章

琼简

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习实战之AdaBoost元算法（三）示例：在一个难数据集上应用AdaBoost

转载请注明作者和出处：https://blog.csdn.net/weixin_45814668知乎：https://www.zhihu.com/people/qiongjian0427Git：https://github.com/qiongjian/Machine-learning/运行环境：anaconda—jupyter notebookPython版本： Python3.x更多精彩内容，尽在微信公众号，欢迎您的关注：目录步骤自适应数据加载函数步骤(1)收集数据：提供的文本文件。将
复制链接

扫一扫