从2月28号开始报名大数据微专业,到4月29号看完最后模块的视频。两个月的时间,收获非常大。早在上班的时候就对大数据的技术非常好奇,后来考了研,终于有时间和机会来系统地学习。由于我不是cs本科出身,在报名这门课之前,我自己学习了很多前置知识,比如linux,数据库,java,python。我能在比较短的时间内完成这门课的学习主要得归功于前置知识的掌握。

    在线技术课程我看过很多,就这么课来说,穿插着手把手教你的操作和原理讲解。我认为在线课程老师的声音、说话节奏以及普通话水平是衡量一门课能不能听下去的一个重要指标,孟硕老师在这几方面都非常棒。整个课程的逻辑设置非常合理,从需要的linux知识讲解,到hadoop基础组件,再到hive,hbase,再到spark的各个接口,甚至包括必备的数学基础。值得一提的是,学了这么长时间的线性代数和矩阵分析,才在这门课里明白了特征值、特征向量到底意味着什么。

    学习这门课程,最重要的就是不能怕麻烦,开始跟着老师搭环境,后续所有的操作都要自己尝试,而且需要记笔记。很多细碎的知识点如果不放在笔记中,很快就忘了甚至忘了是哪个视频里讲的。重要的事再怎么强调都不过分,不能怕麻烦。我的环境就崩过很多次,有想给硬盘扩容自己作死的,有莫名其妙组件不好使重新装的,有我没法解决的linux的莫名其妙的问题导致的。尽管会浪费一些时间,但是没有合适的环境学习大数据,绝对是一件不靠谱的事。

    我的写作水平自己心里是有数的,但还是希望对大家有所帮助。