摘录:公众号-全球人工智能 2017-07-03 推送文章
学习数据科学时的错误
重视局部,忽略整体
花费太多时间在理论上
数据科学是应用领域,巩固技能的最好办法是实践
You should:
平衡你的研究与项目实践
学会适应局部知识,当你进步时,自然会填补空白
了解每一部分如何适应大局从头开始编写太多的算法
算法正在成为一种商品,直接使用成熟的机器学习库及基于云的解决方案
更重要: 了解如何在正确的设置中应用正确的算法
You should:
使用通用的机器学习库,如Python scikit-learn
除非是为了学习而不是完善你的实现,你才从头开始编写一个算法
理解现代机器学习算法的环境及其优缺点- 急于深入更高的层次
掌握基本原理很重要
You should:
首先掌握“经典”机器学习技术及算法,以此作为高级课题的基石
发现、使用富有成效的方法
学习一套系统的方法来解决任何形式的机器学习问题
求职时的错误
- 简历中太多专业术语
简介明了,要点阐述清晰,展现你能给公司带来的影响
You should:
不要简单列出你所使用的编程语言或库,描述你如何使用它们并解释结果
少即是多:考虑强调最重要的技能,并突出它们
制作一个简历主模板,可以根据不同职位定制不同版本,并保持整洁 - 高估学位的价值
很可能,学校学习的东西与企业中应用的机器学习完全不同
You should:
用真实数据集做项目实践
参加相关实习
学会使用机器学习的系统 方法
向一流数据科学家学习 - 搜索内容太狭隘
许多职位没有被称为“数据科学”,但它们需要类似的技能
You should:
按所需技能搜索:机器学习、数据可视化、SQL等
按工作职责搜索:预测建模、A/B测试、数据分析等
按所需技术搜索:Python、R、Scikit Learn、TensorFlow等
按职位名称扩展搜索范围:数据分析师、定量分析师、机器学习工程师等
面试时的错误
- 没有事先做讨论项目的准备
回答“你会如何”这类面试问题,以此作为主要的安全保障
面试官会关注你独立自主的能力,因为数据科学的职位包含项目管理的要素,因此你要理解整个数据科学的工作流程,了解如何将所有内容整理在一起
You should:
完整的端到端项目,实践每一个主要步骤
组织你自己的一套方法,数据科学是深思熟虑、严谨、充满逻辑性的
回顾和实践过去的实习、工作或课程中所做的项目 - 低估领域知识的价值
技术技能和机器学习知识是获得数据科学职位的基本前提
要真正脱颖而出,你应该更多地了解你将运用技能的具体行业知识
数据科学永远不会存在于真空中 - 忽视沟通的技巧
数据科学团队比较小,数据科学家倾向于在更多跨功能的环境中工作
注重你和不同技术背景和数学背景的同事交流的能力
You should:
向非技术受众讲解技术概念,锻炼相关能力
为常见面试问题准备要点,并练习回答问题
实践分析各种数据集,提取关键见解,并展示你的发现