欢迎阅读我们的7部分数据科学和机器学习小型课程的最后一章。
我们真的涵盖了很多方面。
- 在 第1章中,您看到了整个机器学习工作流程的鸟瞰图。
- 然后,在 第2章中,您学习了快速,高效且具有决定性的探索性分析框架。
- 第3章是关于数据清理的,这可能是最重要的一步。
- 接下来,在 第4章中,我们分享了我们最喜欢的特征工程启发式方法。
- 在 第5章中,我们讨论了正则化和集合,并且您了解了5种利用这些机制的算法。
- 在第6章中,我们在其他步骤正确完成后,通过了经过验证的公式来训练优秀的模型。
在本指南中,我们将为您提供最佳建议,包括如何将这些概念转化为可以显着影响您职业生涯的宝贵实用技能。
机器学习自学的话是从现在开始单独进行,并开始将这些技能应用于您感兴趣的项目。
您学到的循序渐进的蓝图将为您提供一个巨大的开端。但是当铁很烫时罢工!选择一个主题,找到一个数据集,然后开始练习。
对于工具,我们强烈推荐Python堆栈,包括以下库:
- NumPy 用于高效的数值计算。
- 用于数据管理的熊猫。
- Scikit-学习 算法和模型训练。
- Seaborn 易于/常见的可视化。
- Matplotlib 自定义可视化。
掌握核心工作流程后,您可以使用本课程的其余部分作为继续学习的指南。
我们自学的第一个提示是跳过教科书并尽快跳进项目,因为在上下文中学习要快得多,即“边做边学”。
此外,保持积极性并继续前进将更容易。
原文:https://elitedatascience.com/next-steps