[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之五

 通过示范引领,激励多方主体积极参与,释放数据要素价值。

本文为“数据要素×”典型案例深度解析系列的第五篇,前四篇请见

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之一

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之二

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之三

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之四

在第七届数字中国建设峰会的第一天,即5月24日,国家数据局会同各领域主管部门,包括生态环境部、交通运输部、金融监管总局、中国科学院、中国气象局、国家文物局、国家中医药局等部门一起,发布首批20个“数据要素×”典型案例。

01   案例之九|中科院系-多元数据融合 支撑空间与天文科技创新发现

——————————————————

话说鼹鼠哥本人自从在2010年开始投身云计算和大数据以后,和中科院系还是打过不少交道的。

在刚开始做大数据的时候,还没有那么多的分布式存储,什么HDFS,Ceph,Gluster当时都还没出现,或者还都在1.0版本之前没法商用,而当时Lustre是一个不错的选择,当时在国内应用Lustre最多的,就是中科院的高能物理所。

众所周知,随着人类探索宇宙起源以及基本物质组成的脚步不断前行,高能物理实验的规模也在不 断扩大,欧洲大型强子对撞机 LHC、北京正负电子对撞机 BEPCII、大亚湾以及江门中微子实验、羊八井国际宇宙线实验、高海拔宇宙线观测实验 LHAASO 等大型高能物理实验已经建成运行或者陆续建成,这将累积越来越多的数据。比如,LHC 每年会产生 25PB 的数据, 采用网格计算模型进行全球分布式的处理与分析。BEPCII 累积超过 5PB 的数据,主要采 用大规模计算集群进行分析。 

这样的庞大的数据对高能物理计算环境提出许多新的挑战,包括海量的数据存储能力、 超强的计算能力、高速数据传输、大规模分布式的协同处理机制等。总体来说,高能物理计 算主要有如下需求: 

首先,高能物理的数据量巨大。随着新一代高能物理实验装置的建设完成,实验规模不 断扩大,实验复杂性也不断增加,数据产生量越来越大。目前,全世界高能物理的实验数据 已经达到 200PB,并将很快超过 1000PB。 

其次,数据需求全球共享。比如,全世界 8000 多位物理学家对 LHC 每年产生的 25PB 的实验数据进行分析。BEPCII 上的 BESIII 实验、大亚湾中微子实验等都是大型国际合作项 目,有着同样的需求。 

最后,高能物理中很多数据需要长期保存。比如,LHC 和 BESIII 实验的原始数据必须 保证在实验结束后至少 15 年以上的生命期内还可被利用。 

这里科普一下,PB就是1000个TB,每个TB又是1000个GB,咱们现在普通笔记本一般也就是1TB的大小,这些科学数据大概相当于20万个笔记本硬盘的空间,而且这还是在大概十年前的数据,现在估计早就又要加上3到4个0,也就是几千万到几亿个笔记本硬盘了。

你也许会说,银行存的数据也不少啊。但是这个地方有一个区别,银行的数据很多会归档,比如你可能没法直接查到10年前的交易流水,但是到柜台可以申请调取,这就是去后台调取归档数据。但是科学数据需要时时访问到全部数据,这是很大的差异。

不知不觉就说多了,后来我们还和中科院声学所一起开展音频大数据的研发,包括声纹识别,关键词识别等等,虽然现在看起来不难,可是那是在差不多十年前,没有什么大模型也没有GPU的时候。

后来我们的一位同事就是去了贡献这个案例的其中一个机构,转行做了科学研究,现在也小有成果了,这个系列案例的详情我还是从她的朋友圈里最先看到的。

这里我们注意到一点,就是空间数据的数据量,也达到了50PB,而高能物理应该是高出一到两个数量级了,我们简单算一下,一台存储专用服务器大约裸容量是100TB,50PB就需要500台服务器,乘以3倍冗余,就是1500台,再加上其他的机器,大概2000台,需要大约150个机柜。所以,单单建设一套支撑这么大数据量的分布式存储系统,支撑高速的读写,并且确保数据的高度一致性和可用性,已经是一件很不容易的事情了。何况还要进行标准规划,以及全生命周期的治理,所以这个案例的含金量还是很高的。

下边是案例正文:

空天科技是一种跨学科、跨领域、跨行业的综合性科技。中国天眼FAST、子午工程等重大科技基础设施建成应用和空间科学系列卫星的发射启用,产生海量数据。该类数据标准不一、来源分散、类别多样,深度应用较难,为高效应用空间天文数据,丰富研究方法,提升处理应用方式,更好地支撑复杂科学问题研究,国家空间科学数据中心、国家高能物理科学数据中心、国家天文科学数据中心等联合通过强治理、研工具,探索形成基于数据的天文领域科学创新模式。一是促进空间-高能物理-天文科学数据汇聚与全生命周期治理。编制分级分类、管理存储、开放共享等空间高能天文领域系列数据标准10余项,以标准为引领,规范实施全生命周期数据治理,促进跨学科数据汇聚融合。

二是建立空间高能天文领域融合数据库。聚焦跨领域前沿科学问题,面向科学真实需求,打造空天典型事件等数据库,发布空间科学、高能物理、天文学联合主题数据资源。自2021年以来,治理形成高质量空间天文科学数据资源约50PB。

三是以数据驱动科学新发现。依托融合数据库、借助人工智能等,联合研发了20余项专用数据分析挖掘工具与模型,推出以超高能宇宙线起源、多波段时域天文、日地空间天气传播链等不同科学场景的高质量在线数据分析应用,服务空间天文领域科技系列创新活动,服务科技计划千余项,助力取得“全球首次打开了10TeV波段的伽马射线暴观测窗口”“获得纳赫兹引力波存在的关键证据”等数十项国际领先的原创性、标志性、突破性科学发现,相关成果发表于《自然》《科学》等国际顶尖学术期刊,多项成果入选当年“中国科学十大进展”。

图片

三中心联合发布高能瞬变源多波段监测数据专题,提供面向科学问题的跨领域数据发现服务

图片

AI for Data空间与天文领域系列专用软件工具

图片

02   案例之十|湖南省博物院-数据资源融合应用 助力文物传承保护和价值增值

——————————————————

看到博物院,想跟大家谈谈体验消费。

疫情后,体验消费在各个行业中迅速崛起,成为一种新的消费趋势。去年,甘肃省天水市的“天水麻辣烫”引发了广泛的讨论和关注,成为体验消费的一个典型案例。天水麻辣烫不仅使当地餐饮市场持续火热,还带动了周边的零售、服务和文旅等消费市场的同步升温。相关数据显示,近两周天水辣椒面、定西土豆等土特产品的成交额环比增长均超100%,3月以来天水景区门票相关订单量显著增加。

除了天水麻辣烫,还有许多其他案例展示了体验消费的魅力。例如,宜家的移动小睡车、耐克体验中心和箱根牧场等,都是通过深度互动的营销策略,让消费者与产品和企业之间进行互动,从而提升消费者的体验感。这些案例表明,体验消费不仅仅是简单的购物行为,更是一种文化和情感的交流。

那么,为什么体验消费突然火起来了呢?笔者认为主要有以下几个原因:

消费者需求变化:现代消费者更加注重个性化和情感化的消费体验。他们不仅仅满足于商品本身的质量,更在乎购买过程中的感受和体验。体验消费能够满足这种需求,提供更多的附加值。

社交媒体的影响:社交媒体平台的兴起使得体验消费更容易被传播和推广。通过短视频、图片等形式,消费者可以分享自己的体验,吸引更多人参与。例如,天水麻辣烫通过短视频传播,迅速走红全国。

技术进步:随着虚拟现实(VR)和增强现实(AR)技术的发展,博物馆、餐厅和其他场所能够提供更加沉浸式的体验。例如,AR导览在博物馆的应用,打破了传统二维静态展示的边界,实现了三维动态立体展示,让文物“活”了起来。这种技术的应用不仅提升了游客的满意度和忠诚度,还促进了文化遗产的民主化。

博物馆作为文化传承的重要场所,也在积极采用新技术来提升游客的体验。

增强现实(AR)技术的应用:博物馆通过AR技术,将虚拟信息叠加到现实世界中,为游客提供更加丰富的互动体验。例如,河南博物院利用AR技术,让游客能够与展品进行互动,增加了观展的乐趣。此外,荷兰梵高博物馆通过AR技术,创造了沉浸式的展览《遇见梵高之旅》,吸引了大量年轻观众。

虚拟现实(VR)技术的应用:VR技术可以让游客在虚拟环境中亲身体验历史事件或文化场景。例如,某项目采用66台OptiTrack动捕摄像机和定制化文物道具,通过VR交互体验,打造了现实版“博物馆奇妙夜”。这种技术的应用不仅提升了游客的满意度,还满足了人民群众多层次的文化消费需求。

数字化创新:博物馆通过虚拟现实、应用程序APP、人工智能等方式开启文化体验之旅,旨在增强技术精湛的访客体验。这些技术的应用使得博物馆不再是单一的展示空间,而是变成了一个充满互动和探索的乐园。

总之,体验消费正在成为现代消费市场的重要趋势。通过技术创新和消费者需求的变化,各行各业都在不断改进和升级,以提供更好的消费体验。博物馆行业也不例外,通过引入AR、VR等技术,极大地丰富了游客的体验,推动了文化的传承和发展。

下边是案例的正文。

推动数字技术与文物保护利用融合发展是建设文化强国的关键举措。目前,文物数据资源应用率较低,数据要素在文物的保护、管理、传播、利用中发挥的作用不足,难以对文物关联行业的数字化发展起到足够的支撑作用。湖南省博物院积极推进文物数据资源的挖掘、汇聚和利用,通过创新合作开发模式,推动文物数据资源协同优化、复用增效、融合创新。

一是多手段采集汇聚文物数据资源。通过高清影像拍摄和激光扫描等手段,采集文物数据103万条、图片11万张、三维模型2000余个,编制文物数据采集加工地方标准,推动构建马王堆汉墓文物、音乐文物等文物知识图谱,并将文物中涉及的传统医药、农牧渔猎、服饰服装、餐饮美食、礼仪文化、人物事件等元素进行数字化映射、匹配、提取和转化,形成多种文物数据资源集。

二是构建文物数据授权和合作开发模式。积极与高校、优质企业、文化创意团体等签署整体授权或单项合作开发协议,免费开放品牌资源和文化数据库授权,联合打造“数字汉生活”文化IP系列产品,实现文物数据资源在不同领域中的复用增效。先后签约近50家企业和团队,带动近10亿元规模的文化创意及周边产业发展。

三是推动文物数据跨领域融合创新。面向不同行业、不同人群等差异化需求,设计、制作、推出马王堆复原京剧展演、多年龄段“辛追”数字人、文物实景解谜游戏及数字藏品等系列产品。自2022年以来,以汇聚形成的文物数据资源为基础,先后推出云展览、云教育、动画视频、沉浸式体验等200余项数字化项目,浏览量超过1200万次;同时举办2个大型线下数字展览,吸引60余万观众,实现2300万元票房收入,推动了文化传承和文物价值增值协同发展。

沉浸式体验、数字人、元宇宙及数字藏品等数字产品

图片

数据资产化,鼹鼠哥与你一起。

图片

任何问题,欢迎大家公众号后台留言沟通。

  • 20
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值