这是一位学习Java软件开发学员(在读本科生)的困惑と担忧,相信也是很多想深入学习大数据人员的疑虑。为此,整理多方学习策略,欢迎各位老铁有好的方法在下方留言,不吝赐教,共同学习。
策略一
想从事大数据、海量数据处理相关的工作,如何自学打基础?
想做数据处理尤其是大数据量处理的相关工作必须兼具计算机科学基础和统计基础。
现在有一个高大上的职业叫数据科学家,有人说数据科学家就是一个比程序员更懂统计的统计学家,一个比统计学家更会编程的程序员。觉得说得很形象。
考虑到你还是在读本科生,有很多知识和课程还需要作为基础来学习和巩固。
基础中的基础:
线性代数,概率论
核心知识:
数理统计
预测模型
机器学习
计算机:
数学软件:强大矩阵运算和优化功能的matlab,专而精的mathematica。
语言:python(很流行的科学语言,潜力也很大,ipython这样交互式环境十分有利),fortran(强大的计算语言,充分优化的现成代码),R(