声明:原文地址:使用TPOT自动选择scikit-learn机器学习模型和参数,此文是本人学习原文的结果,略有改动。侵删。
在上一篇博客中我们在anacoda中安装了tpot: anacoda下安装TPOT库。有需要的可以去看一下。
正文:
scikit-learn是抽象层次很高的机器学习库,它提供了许多机器学习模型,而每个模型还有很多参数。那么问题来了,我们该怎么选择某个问题最适合使用哪个模型呢?
当然,我们一个一个尝试,或使用TPOT自动化这个过程。TPOT是基于遗传算法自动选择、优化机器学习模型和参数的工具。遗传算法常来解决优化和搜索问题,本博客就使用例子介绍一下TPOT的使用。
数据集地址:https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/
使用的数据集:breast-cancer-wisconsin.data
打开以后是这个样子: