作者:Kittyhawk
链接:https://www.zhihu.com/question/387911866/answer/1155086633
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
我本科在美国读的统计学,研究生读的cs,切身感受挺大的。
我读本科那会儿大数据机器学习都没有正式兴起,读统计完全是因为工科怎么看都太难了,统计似乎没那么难,而且据说在理科中比较好找工作,于是就入了坑。刚开始体验挺好的,像概率论数理统计这些课也只是反复手动计算一下pvalue或者算一下概率,并不需要编程知识,即使是后来的生物统计课老师介绍了一下R我也只是把他当作高级计算器在用。我一直以为统计就是提供咨询服务的。
不久后我就开始上统计计算这门课,这算是我第一次接触编程吧。当时统计出身的本科硕士毕业生大部分会去找药厂的工作,而药厂大多用SAS(这样语言本身有错误的话有人背锅),所以我们的课程设置也是用的SAS。这时候我才发现我前面学习的那些理论在实际应用中都要通过计算机来实现呀,数据大起来手算根本不现实。即使这不并不是通用的计算机语言,我仍然学习得非常吃力。上完这门课后,我第一次觉得想把统计的知识应用到实际问题中,好像还得懂一些计算机才行,但是这时候我还是认为只要会用,能得出个结果就行了,并不需要花时间把代码写好。
第二次遇到问题是在后来的贝叶斯统计课上,我们期末项目要对后验分布做mcmc采样。理清思路后开始用R撸代码,反正只要得出个结果就行,自己想怎么写就怎么写呗。于是我就开始不断在R上各种用for loop,从来不定义函数,觉得两段代码差不多的话就直接一长段复制粘贴,写完之前从来不调试。自己觉得