《Approaching (Almost) Any Machine Learning Problem/解决几乎任何机器学习问题》

u013250861

已于 2023-09-13 12:53:52 修改

阅读量1.2k

点赞数 1

分类专栏：机器学习/ML 文章标签：机器学习人工智能

于 2023-09-13 12:40:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/132850163

版权

机器学习/ML 专栏收录该内容

38 篇文章 26 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详述了解决机器学习问题的通用流程，包括数据预处理、模型选择、超参数优化等步骤。作者强调，大部分时间花费在数据转换，而模型应用涉及数据清理、表格化、标签定义、评估指标选择、库的使用以及模型框架。文中提到了pandas、scikit-learn、xgboost等关键库，并推荐了基于集成树的模型如RandomForest、XGBoost。此外，还介绍了特征工程、数据分解方法如PCA和SVD，以及特征选择策略。

摘要由CSDN通过智能技术生成

解决几乎任何机器学习问题(完整翻译)

英文原文：Approaching (Almost) Any Machine Learning Problem

Kaggle团队| 07.21.2016

Kaggle大师Abhishek Thakur最初在2016年7月18日在这里发表了这篇文章。

一个数据科学家每天处理大量的数据。有人说，超过60-70％的时间花在了数据清理，数据转移和数据采集上，使得机器学习模型可以应用于这些数据。这篇文章的重点是第二部分，即应用机器学习模型，包括预处理步骤。这篇文章讨论的流水线是我参加过的一百多次机器学习比赛的结果。必须指出的是

了解本专栏

超级会员免费看

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。