python自动化算法_用Python自动化你的机器学习过程——TPOT和基因算法

最新推荐文章于 2024-03-24 00:39:52 发布

weixin_39560604

最新推荐文章于 2024-03-24 00:39:52 发布

阅读量801

点赞数 2

文章标签： python自动化算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39560604/article/details/111807587

版权

本文介绍了Python中的自动机器学习（AML），特别是使用TPOT包和遗传算法来自动化机器学习过程。TPOT允许在不同参数和配置中进行搜索，以找到最佳机器学习模型。文章通过示例展示了如何使用TPOT进行分类和回归任务，并讨论了遗传算法的参数设置。

摘要由CSDN通过智能技术生成

自动化机器学习(Automatic Machine Learning，简称AML)是一种流水线(也称管道)，它能够让你自动执行机器学习(ML)问题中的重复步骤，从而节省时间，让你专注于使你的专业知识发挥更高价值。最重要的是，它不只是一些模糊的想法，而是我们已经可以使用很多基于标准python ML包建立的应用包，如scikit-learn等等。

在这种情况下，任何熟悉机器学习的人都可能会回想起网格搜索(grid search)这个概念。他们这样想是完全正确的。实际上，AML是在scikit-learn中应用的网格搜索的扩展，而不是迭代这些值预先定义的集合和其组合，它通过搜索方法，特征，变换和参数值来获得最佳解决方案。因此，AML「网格搜索」不需要在可能的配置空间上进行详尽的搜索——AML有一个很赞的应用叫做TPOT包，其提供了像遗传算法这样的应用，可用来在某个配置中混合各个参数并达到最佳设置。

在这篇文章中，我将简要介绍一些AML的基础知识，然后在应用中使用TPOT软件包，并且包括遗传算法解决方案的优化问题。

基础概念

基本概念非常简单，一旦我们收到原始数据，我们就开始使用标准的ML流水线。

在这条流水线中，我们有一些针对于给定数据集／问题的步骤，很明显数据清理的自动化是一个问题。然而，在这个过程中，我们得到以下任务：特征预处理

特征选择

模型选择

...

这些任务的共同之处在于，在每个方案中我们先使用一组方法，然后我们评估其性能(特征重要性&#x

最低0.47元/天解锁文章

weixin_39560604

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。