如何在行业中成为一名成功的机器学习工程师?

                欢迎来到雲闪世界。你有没有想过,要成为一名成功的机器学习工程师需要什么?你是否很难确定自己在这个充满活力的领域中的角色?我也有过这样的经历!

        今天,我将分享五条秘诀,这些秘诀帮助我作为 BigTech 的高级机器学习工程师获得了“超出预期”的评级。

💻 建立基础

您需要很好地理解机器学习基础知识,并了解其在实际应用中的局限性。

了解核心概念

  • 掌握监督学习与无监督学习、分类与回归的基础知识以及深度学习的基础知识。
  • 了解误差指标、目标函数以及每种方法的局限性至关重要。

专业提示

从Coursera 机器学习开始,它会向您介绍所有核心概念。

我还建议阅读Andriy Burkov的《百页机器学习书》和《机器学习工程》,以了解有关应用机器学习的更多信息。

如果您对深度学习更感兴趣,请查看 Coursera深度学习专项课程。建议在学习本课程之前先通过基础课程掌握 ML 的基础知识。

了解图书馆

  • 了解核心 ML 库,例如 TensorFlow、PyTorch 和 scikit-learn。
  • 在 Kaggle 等平台上开展小型项目将帮助您在职业生涯早期熟悉这些库。

专家提示:

强烈推荐 educative.io 的机器学习工程师课程,它介绍了大多数库和功能。

了解最新研究成果

通过阅读最新论文和参加KDD等会议,了解您所在领域的最新研究。这将增强您的信心并确保您了解当前趋势。

由于我对搜索中的 NLP 应用很感兴趣,因此我熟悉了Word2VecBERT等里程碑式的论文以及大型语言模型的最新发展。

💪 发挥你的优势

作为 MLE,请专注于自己的优势并在经验不足的领域寻求帮助。以下是您可能履行的一些主要职责:

1)数据和特征工程:你经常需要查找并准备自己的数据。这涉及:

  • 理解问题:掌握问题陈述并确定哪些数据最为关键。
  • 识别数据源:查找原始数据的相关来源
  • 数据预处理:清理和格式化数据以使其可用。

2)建模:这涉及通过 ML 模型将数据转化为可操作的见解。关键步骤包括:

  • 了解领域:对您正在工作的领域进行研究。每个领域都有自己的挑战。
  • 制定问题:定义您要优化的内容以及您需要使用的目标函数。
  • 创建基线:确定项目的最低可接受性能。
  • 训练模型:寻找并训练合适的模型。

3)模型部署和可扩展性

  • 了解规模:了解模型的运行规模以及满足这些要求所需的技术。有多种技术(如 Amazon Sagemaker 和 Tensorflow Serving)可提供大规模模型部署框架。
  • 鲁棒性:确保模型推理与现有系统很好地集成,并能处理真实世界的流量。
  • 专业提示:查看 Udacity 的机器学习工程师纳米学位,了解使用 Sagemaker 进行部署。对于 Tensorflow Serving,他们的用户指南非常好。

🎯 关注业务目标和数据​​​​​​​

我个人对此感到很苦恼,我知道很多 MLE 也是如此。我们经常在不考虑业务目标的情况下改进模型。与这些目标保持一致可确保项目满足预期并实现价值。

  • 确定业务目标或用户目标:了解业务目标——收入、用户体验、减少欺诈等。
  • 定义问题陈述:制定与业务目标相符的问题陈述。

示例:为了增加流媒体服务中的用户会话数量(业务目标),优化点击率以提高用户参与度(问题陈述)。

  • 用数据验证假设:用数据分析支持你的问题陈述。

示例:对于优化点击率的推荐系统,分析用户交互数据以识别模式和偏好。

  • 了解局限性:选择适合领域和业务需求的模型。

示例:如果目标是向卖家提供透明度,说明哪些产品功能可以推动电子商务平台上的销售,那么决策树等更简单、更易于解释的模型可能比深度学习模型更合适。

🔍 了解投资回报率 (ROI)及其权衡

您是否能在面向用户的应用程序中部署具有数百万个参数的大型语言模型 (LLM),延迟为 100 毫秒?可能不行。资源限制是关键的考虑因素,但经常被忽视。

  • 权衡:了解项目权衡并设定明确的里程碑。平衡时间、资源和模型性能。

示例:根据项目目标和可交付成果,选择为期一年、由四名工程师参与的项目来开发可实现高性能的复杂模型,或者选择为期六个月、由两名工程师参与的项目来开发模型性能略低的复杂模型。

  • ROI:评估模型的投资回报率。选择能够平衡性能和预算限制的模型。

示例:如果最先进的模型需要数百个 GPU,但更简单的模型可以在更少的资源上高效运行,则后者可能更实用。

  • 迭代过程:从资源高效的模型开始并迭代改进它们。

🔁 拥抱实验

机器学习是实验性和迭代性的。你从一个模糊的问题开始,提出假设,部署解决方案,学习并完善。

  • 尽职调查:彻底研究和分析该领域,以预测和减轻潜在的意外。
  • 从反馈中学习:使用用户反馈和性能指标不断改进模型。
  • 从失败中学习:分析自己和他人的失败,以找出弱点,改进模型架构,并了解数据集问题。

🌟 额外提示:指导和交流

在行业内建立联系可以加速您的学习,开辟新的机会,并在您的整个职业生涯中提供宝贵的支持。

  • 寻找并成为导师:寻找导师来指导并指导他人以巩固你的知识。在我职业生涯的早期,得到强有力的导师支持帮助我克服了障碍。
  • 积极建立人际网络:参加会议、聚会和网络研讨会。加入在线社区以了解最新动态并分享知识。

最后我想说的是,我并不声称自己知道所有问题的答案,但我相信持续学习和分享知识的力量。本文就是我这样做的方式。我致力于发布对任何对机器学习感兴趣的人(从初学者到早期专业人士)来说都是宝贵资源的文章。您的支持和反馈将是无价的。

感谢关注雲闪世界​​​​​​​。(亚马逊aws和谷歌GCP服务协助解决云计算及产业相关解决方案)
订阅频道(https://t.me/awsgoogvps_Host)
TG交流群(t.me/awsgoogvpsHost)

  • 19
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值