摘要
【目的】随着大数据时代的到来,科学研究方式的计算型特征日益明显,计算型科研已成为新时期科研模式变革的重要方向。【方法】通过对计算型科研产生背景、内涵、理念的分析,探讨了在数据密集型环境下,计算型科研在基础设施、研究对象和研究方法方面对科研活动所展现出的新需求。【结果】以农业领域为应用场景,从环境营造、数据共享、协作体系、装备研发和素质培育5个方面为农业科研的发展提供了启示,以期能够全面提升计算型科研面向农业创新与管理的“融入环境、嵌入过程”的能力,有效支撑农业领域科研模式的转型升级。
关键词: 计算型科研; 数据密集型环境; 农业科研; 应用实践; 启示
引言
进入新世纪的第二个10年,以大数据、人工智能为代表的战略性信息技术呈现出叠浪式发展的态势,不同技术之间的横向融合及其对科学研究交互应用的渗透广度、深度进一步加强,大数据及其相关技术所带来的思维、理念和方法对科研领域全方位赋能的同时,也显著拓展各学科领域研究范围和创新能力,继而对科研模式的方方面面产生了颠覆性的影响[1],形成了“科研信息化、信息数据化、数据知识化”科研治理新业态。在这一背景下,科研人员也在积极思考应对在数据密集型环境下科学研究工作所面临的挑战,迫切需要构建一种面向海量数据的新的研究方法、模式、技术和服务[2]。就理论基础而言,这种基于数据的研究方法与分析技术注重于从海量数据中抽取研究对象的变化规律和内在联系,主张以量化、计算和自动化的理念,从数据出发,应用先进的计算技术和定量方法,开展数据化分析、数据驱动决策以及智能化分析应用等[3]。这意味着,在大数据环境下,未来科学研究会显现出以数据为中心,以定量化和数据化分析为原则,拥有智能性、融合性和可自动处理性等计算型特征,这种具备计算特征的科研活动可被概括为“计算型科研”。就本质而言,计算型科研作为一种基于数据密集型科研范式的新型科研模式,是“计算型思维”扩展到科研领域的表现形式,也是“第四科研范式”发展的一个新阶段。在实践中,计算型科研能够推动人工智能、网络分析、建模仿真等数据分析处理技术与科研活动的深度融合,减少传统基于人工判断所引发的主观性误差,真正实现数据在科研活动中的要素驱动作用[4]。可见,计算型科研是大数据时代科研活动发展的一个必然趋势[5],了解和应用计算型科研思维理念和技术方法,对于提升科研创新能力,应对数据密集型科研范式变革具有重要意义。
1 计算型科研的来源与特征
随着大数据时代的到来,科学研究活动正从传统的理论科研、实验科研向数据密集型科研转变[6]。在这一过程中,基于定性和实验现象分析的科研模式已经无法满足日益复杂的科研活动需求和科技创新任务,进而需要面向海量数据所开展的精准化、细粒度的分析来提升科研创新的质量[7]。在这种科研模式变革的背景下,2007年美国国家工程院院士Jim Gray第一次提出了科学研究领域的第四范式的概念[8]。在此基础上,哈佛大学的Lazer教授等人基于“Data Intensive Computing(数据密集型计算)”的理念提出了“Computational SocialScience(计算型社会科学)”的概念,强调利用数据分析技术来开展社会科学研究工作,从数据计算结果和各类信息的相关性来揭示研究对象的内在变化机理和运行规律。在实践中,伴随着上述理论的扩展,计算型科研模式逐渐演变成型,它的本质是一种数据驱动型的研究模式,是以大数据为研究基点,综合实验、推理和模拟等研究方法要素,并能有效应对当前海量数据挑战的新型研究方式。在计算型科研模式下,科研活动过程在直接面对被研究物的同时,注意力更多地转向到探索海量数据中所蕴含的信息。在这一过程中,研究者所面临的研究客体、数据形式、科学分工、研究驱动方式和科学发现模式等要素也随之产生了很大变化[9]。因此,在科研实践中,与描述自然现象的实验科学、采用模型或归纳法的理论研究,以及使用计算机进行模拟复杂现象的仿真科学的科研方式相比,计算型科研模式是以数据为研究基础,通过实验、理论、仿真融合的方法开展研究活动,其具有以下特征:
(1)在研究对象上,表征具体研究对象的海量数据在研究过程中的地位不断提升,使研究对象呈现出来源多样化、结构复杂化、数量海量化的特性[10]。因此,大量数据的获取和从大量复杂数据中获取有用数据以及洞见知识的能力将成为计算型科研模式开展的关键。