全文共2458字,预计学习时长5分钟
图源:Unsplash 摄影:Skye Studios
本文将对如何构建数据科学作品集进行深入介绍。
激情必不可少
如果你真的想做一个数据科学的作品集的话,就不太可能有很多业余时间,致力于建立数据科学作品集肯定需要精力上的投入和时间上的牺牲。根据经验,只有在做一个让你充满激情的项目时,你才能成功做到这些。激情也不一定是一下就能找到的。
写作是一个很好的媒介,因为通过写作能够实现分享想法的激情。也许你很想用深度学习做一个项目,却动力不足,但也许你对音乐充满热情,那你就可以使用深度学习创作音乐的方式来创建作品集。把精力投入到感兴趣的事情上可以在你想要放弃的时候助你突破各种艰难险阻。
提出你自己的问题
在kaggle等数据科学平台上围绕预定义问题做一些辅助性项目非常有吸引力。虽然这样做肯定会使整个过程更容易,但却忽略了数据科学研究过程中最重要的部分之一:提出问题。在应用中,最难的往往是将业务问题转化为数据科学问题。编写代码前请仔细考虑以下问题:
• 我想解决什么问题?
• 怎样才能用数据科学来解决这个问题?
• 如果我能解决这个问题,那会创造什么价值?
你的回答可能很简单。比如说,我想做一些带有我喜欢的乐队风格的音乐,而我经过调查发现深度学习在解决这个问题上已经取得了一些成功,如果我能解决这个问题,就会有听不完的音乐,而这些音乐都