数据科学具有跨学科的特点。数据科学包含什么内容,如何构建其内容体系,众说纷纭。公说公有理,婆说婆有理,场面一时纷纷嚷嚷。
本文的主要观点是,数据科学一定离不开计算机。换句话说,没有计算机的数据科学,可能是假的数据科学。
有些“数据科学”课程,其核心内容是统计分析和数学建模。在数据科学概念正式提出来之前,这样的课程,也有,也能够叫出名字。无他,就是统计分析或者数学建模。现在戴上了一个新帽子,就是数据科学了?很显然,问题很大。
当然,学生为学分所迫,课也上了,还是糊涂。一时间,见识没有打开,没有这么宽广。大学毕业了、研究生毕业了,见了世面;或者有机会和搞计算机的人坐在一块聊一聊。很快就勾兑出来了,就很怀疑,“我学的是不是假的数据科学?”
本文不否认统计分析和数学建模的意义。这些知识对于培养数据科学家是非常必要的,但是我们应该知道,“必要”不是“充分”。
本文反对的是糊弄。统计分析就统计分析好了,数学建模就数学建模好了。不能把二锅头装到茅台酒瓶里,说是茅台酒,你说糊弄不糊弄?