什么是数据科学?数据科学包括数据的科学和科学的数据?

什么是数据科学?众说纷纭。这是可以理解的,因为数据科学还处在创立的过程中。科学的魅力也在于此,比如物理学,从牛顿力学、到狭义相对论、到广义相对论、到量子力学,它处在不断整理、推翻、重建的的过程中,这是一个动态的过程。

有专家认为,为培养人才计,数据科学专业的建立是迫在眉睫的,笔者是同意这样的看法的。从国家意志层面,我们看到,截至2018年3月,教育部已经分三批,批准建立“数据科学与大数据技术”新专业,至此共有200多所高校获批建设该专业。

 

有专家认为,数据科学至少包括两个方面,即数据的科学和科学的数据。这种提法值得商榷。
所谓科学的数据的提法,来自于微软研究院汇编出版的《第四范式:数据密集型科学发现》。科学研究的第一范式,为基于实证方法的研究范式;第二范式,为基于理论推演的理论式研究;第三范式,为基于计算机仿真的计算研究;第四范式,则是基于数据科学的数据密集型研究。基于大型强子对撞机的实验数据实现希格斯玻色子的发现、基于LIGO实验数据对引力波的确认、基于NASA数据寻找系外行星等,都体现了基于大规模数据的科学发现的特点。

“科学的第四范式”可以说先于大数据和数据科学的提出而提出,“科学的第四范式”和数据科学的关系,体现了应用驱动基础理论创新的特点。

但是我们不能够把数据科学,归结为科学的数据和数据的科学两个方面。

因为科学的数据,终究是数据科学的一个应用而已,两者不管谁先谁后出现。数据科学应该研究数据的根本问题,也就是它是关于数据的科学。科学的数据,和政府的数据、金融的数据、互联网的数据、电商的数据一样,都是数据科学的应用,不应该把科学的数据,单拎出来,强调它的重要性。

因为,倘若如此,容易引起读者的思想混乱,对于读者建立合理恰当的知识体系,是非常不利的。打个比方,一个家庭里有好几个兄弟姐妹,其中一位可以和父母、亲戚在大厅上桌吃饭,但是其他几位却只能在厨房,简单吃点,潦草了事,上不得台面,这样的家庭和谐吗?很不和谐嘛。

本文所传达的观点,用下面的一张图可以清晰地表达。

数据科学概论网上资源

https://blog.csdn.net/xiongpai1971/article/details/89364071

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值