摘要: 当开始进入数据科学领域时,我们可能会犯一些错误。本文罗列了9种初学者常见的错误,并提出避免犯错的建议。
更多深度文章,请关注:https://yq.aliyun.com/cloud
如果你想开始一个数据科学方面的职业,你可以通过避免这9个会使你付出高代价的初学者错误来免去几天,几个星期甚至几个月的挫折。
如果你不仔细,这些错误将会消耗你最宝贵的资源:你的时间、精力和动力。
学习数据科学时
第一组错误是“隐蔽的”,很难发现。没有丝毫的预兆,它们如同温水煮青蛙般耗尽你的时间和精力,并且它们产生的误解围绕这个领域。
1.花费太多时间在理论上
许多初学者陷入了花费太多时间在理论上的陷阱,无论是数学相关(线性代数,统计学等)还是机器学习相关的(算法,派生等)。
- 首先,这是缓慢而艰巨的。如果你曾经被所有要学的东西压垮,那么你很有可能陷入了这个陷阱。
- 第二,你也不会保留这些概念。数据科学是一个应用领域,而巩固技能的最好方法是实践。
- 最后,还有一个更大的风险就是如果你不明白你所学的东西与现实内容有什么联系,那么你会变得消极然后放弃。
传统上这种重理论的方法在学术界中传授,但大多数从业者可以从更注重结果的观念中受益。
2.从头开始编写太多的算法
下一个错误也会导致学生片面重视局部而忽略了整体。一开始你真的不需要从头开始编写每个算法。
虽然为了学习而实现一些这么做很好,但现实是算法正在成为商品。由于成熟的机器学习库和基于云的解决方案,大多数从业者实际上从不从头编写代码。
今天,了解如何在正确的设置(以正确的方式)中应用正确的算法更为重要。
- 使用通用的机器学习库,如Scikit-Learn(Python)或Caret(R)(需翻墙)。
- 如果你从头开始编写一个算法,那么这样做是为了学习而不是完善你的实现。
- 理解现代机器学习算法的环境及其优缺点。
3.急于深入更高的层次
有些人进入这个领域是因为他们想要构建未来的技术:自驾车,高级机器人,计算机视觉等。 这些技术由深度学习和自然语言处理等技术所驱动。