均方误差根无法解决所有社会难题
数据科学家一项容易被忽视的能力
- 其实大部分数据科学家所做工作中的一大部分都不是数据整理或者建模或编程,而是一旦你做出了一个结果,你必须要想办法将结果解读给那些完全不具备看懂这个图所必需的技能的人听,例如那些商业决定或者工程决策的重要人物。解读结果是很重要的。你可以用文字去解读它,也可以用可视化的图表去完成,抑或是做一个演示系统去展示你的结果。
- 这项能力并需要耗费太多的脑细胞,但是在公司的项目实战中,这绝对是最重要的环节。不太具备这方面天赋优势的人可以通过授课和指导他们来获得这方面的经验。如果你不是一个很好的程序员,那么你可以通过教授别人写代码和指导别人来提高自己的水平。
均方误差根无法解决所有的社会难题如何理解
- 当人们想起数据科学时,总觉得已经有了一个定义很完美的问题,而且已经有了用来就来解决这个问题的数据集。但是真正的困境是当你处于一个没有被定义的很好的问题的时候。或者是我们对于问题有比较清楚的认识,但是对于如何找到用于解决问题的数据却毫无头绪的时候。
- 对于教育学、政治学或政府干预方面的研究这类的问题很难被建模,它们需要我们有更为发散创新的思维能力。尤其是项目起步阶段,你可能需要想办法做一个实验,收集一些数据,之后再从那些数据开始着手分析。
- 如果你的视野可以远到看出你的产品,或者说你的针对某个问题的解决方案在实际部署以后,会对居民产生什么切实的影响,你就会意识到这个问题其实并不简单,所以说数据科学比从外边看起来更有趣,也更具有挑战性。
- +
科研与工作的区别
- 业界公司总是需要去为别人解决他们的问题,而当你读研进入学校以后,你需要开始自己思考那些问题。而难点在于,那些问题真的很无聊,或者鉴于你没有足够的经验和基础知识,你根本看不出那些问题有什么意义,自然也就对其没有什么兴趣。这也正是研究生阶段导师的重要性所在。
- 我觉得双方都有利弊,并且都在一方面更为严格,而另一方面更为自由。而具体应该做什么选择完全取决于个人做什么工作,他喜欢什么工作,以及你对自我价值的衡量是什么,你如何看待你工作或者学习对社会所做的贡献。
- 读书绝对比在大公司的团队中更让你泯然众人,但是作为一名研究生,你有很多高手可以学习,而其中最弱的一个可能就是你自己,所以你真的需要非常强的执行力来坚持自己的的课程时间表以及解决各种遇到的问题。
如何发掘工具并将其应用在数据科学中
- 我挑选工具的规则就是:我学习这个工具所花费的时间,与我学会他以后对我的工作起到的促进作用和加速作用相比,这两者之间的权衡如何?
- 我总是基于解决问题的想法去学习一个东西的。在这个过程中,我就用很暴力的办法尽力去理解这个东西。如果我们困在某个我难题上即使因为缺少某个工具上的知识,那么就去学它,把拼图中那个缺少的版块补起来。但是整个事情的起点就是,你需要去解决一个问题。
- 我真心觉得现在是数据科学的黄金时期。有太多的机会可以让人们在这个领域建功立业。这绝对是这个领域的早期。当我们谈论数据科学的时候并没有很多人知道我们在说什么,所以证明了这方面的机会非常多。
给新人的建议
- 如果你对学习python或者R不确定的话,直接选一个深深扎下去就行。你只需要随便选一个,然后开始慢慢使用它,你会慢慢从你的错误中学到很多东西,但是记得确保自己总是能问出最正确的问题。
- 一个互联网公司赚钱的所有方法其实在深层次来说就是依赖人们做的决定:做决定买什么东西;做决定点击什么页面;做决定分享某些东西或者与某人来往。
- 上述的所有问题都是社会科学的基本问题,这是数据科学中难学的部分。