数据科学的简单认识

本文探讨了数据科学的发展,从科学研究的第四范式到数据作为资产的观念转变,强调数据从资源到资产的重要性和数据驱动的决策方式。文章还提及了数据分析从统计学到数据科学的演进,以及计算智能如何简化复杂问题。同时,数据科学的应用带来了便利,但也引发了关于隐私和安全的担忧。
摘要由CSDN通过智能技术生成

目录

 

研究范式的新认识——从“第三范式”到“第四范式

数据重要性的新认识——从“数据资源”到“数据资产”

对数据分析的新认识——从统计学到数据科学

对计算智能的新认识——从复杂算法到简单算法

对决策方式的新认识——从目标驱动型决策到数据驱动型决策

数据科学

最好的时代,最坏的时代

数据挖掘、数据分析与数据统计


研究范式的新认识——从“第三范式”到“第四范式

2007年,图灵奖获得者Jim Gray提出了科学研究的第四范式——数据密集型科学发现(Data-intensive ScientificDiscovery)。在他看来,人类科学研究活动已经历过三中不同范式的演变过程(原始社会的“实验科学范式”、以模型和归纳为特征的“理论科学范式”和以模拟仿真为特征的“计算科学范式”),目前正在从“计算科学范式”转向“数据密集型科学发现范式”。第四范式,即“数据密集型科学发现范式”的主要特点是科学研究人员只需要从大数据中查找和挖掘所需要的信息和知识,无须直接面对所研究的物理对象。

数据科学的四范式

第一范式:
几千年前记录和描述自然现象的经验科学。
第二范式:
数百年前利用模型归纳总结过去记录的现象的理论科学。
第三范式:
~~过去数十年~~ 利用科学计算机对复杂现象进行模拟仿真的计算科学。
第四范式:
计算机将模拟仿真,进行分析总结,得到理论,即数据密集型科学。

数据重要性的新认识——从“数据资源”到“数据资产”

在大数据时代,数据不仅是一种“资源”,而更是一种重要的“资产”。因此,数据科学应把数据当做“一种资产来管理”,而不能仅仅当做“资源”来对待。也就是说,与其他类型的资产相似,数据也具有财务价值,且需要作为独立实体进行组织与管理。

我们传统的方法论往往是“基于知识”的,即从 “大量实践(数据)”中总结和提炼出一般性知识(定理、模式、模型、函数等)之后,用知识去解决(或解释)问题。因此,传统的问题解决思路是“问题→知识→问题”,即根据问题找“知识”,并用“知识”解决“问题”。然而,数据科学中兴起了另一种方法论——“问题→数据→问题”,即根据问题找“数据”,并直接用数据(不需要把“数据”转换成“知识”的前提下)解决问题。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值