明确工作目标学习稿:计算技术体系的发展方向

学习2022年《孙凝晖:建立高水平自立自强的计算技术新体系》

计算所新时期的目标就是要建立高水平自立自强的计算技术新体系,其中,针对处理器提出“C体系”、针对信息基础设施提出“信息高铁”体系。

计算技术体系的新结构

包含C体系、信息高铁体系在内,计算技术体系可归纳为以下新结构:

  • 第1层是第五范式建模方法:
    计算技术的根本目标之一是对物理空间、社会空间的规律进行数字模拟(simulation),科学研究第三范式的本质是数值分析建模方法,科学研究第四范式的本质是数据分析建模方法,它们只能对简单系统进行数字建模,而建模对象如多尺度物理、权力运行、疾病的分子机理、农作物生长、社会舆论、军事对抗过程、工业生产流程等属于复杂系统,其数字建模需要第五范式,即智能科学建模方法,包括引入AI方法处理物理模型精确度不够的地方,引入光计算、超导计算、量子计算支撑高维组合优化问题(NP-hard)的近似求解,引入OODA智能流支撑计算-试验在数字物理空间的迭代法建模。
  • 第2层是大数据与AI算法的云化:就是大数据分析引擎、智能算法、智能模型的云化与基础设施化,以及智能算法的安全。
  • 第3层是信息高铁算力网:就是全球一台算力大电脑。
  • 第4层是智能计算机:包括智能超算与边缘智能计算机,牵引性指标是OODA-Loops。
  • 第5层是计算系统安全增强技术:就是在处理器、操作系统、编程语言、存储系统、机群、云计算系统等各层都要有可验证、可构造的安全增强技术,形成新的系统内安全防护体系。
  • 第6层是C体系处理器:就是面向处理器生态可控的开源开放、敏捷设计的技术体系,是处理器芯片全国重点实验室的主要任务。
  • 第7层是集成芯片制造方法:芯片设计与制造方法从以前的堆叠法变为构造法,包括复杂芯片分而治之设计方法、芯粒集成制造方法、芯片3D集成方法等。

什么是C体系

“C体系”狭义上指我国构建处理器生态的第三条道路及其技术体系。处理器难的不是做出一款芯片,或者实现一个技术指标,而是处理器生态怎么构建,技术体系怎么可控。
从构建处理器生态的道路及其技术体系这个角度,可以把我国技术体系归纳成A、B、C三个并行的体系。

  • “A体系”:我国信息化的主流平台被X86、ARM生态所占领,海光、海思等国产处理器的道路强调“全兼容”
  • “B体系”:强调“全自主”,以龙芯和申威为代表,因为不跟市场主流兼容,所以生态弱,一大任务是兼容技术,从指令集、操作系统这一层去兼容,把国外控制生态上的大量应用迁移到“B体系”中来
  • “C体系”:走开源的道路,全世界一起来建生态,谁也不控制谁,谁也不能卡谁,像香山RISC-V、寒武纪NPU就是走的这条道路

什么是信息高铁

把信息基础设施新技术体系叫做“信息高铁”,其内涵是全球算力网(World Wide Computing, 简称WWC),是相对于全球万维网(World Wide Web)的新一代信息基础设施。

核心技术特征是互联网模式并网、低熵高通量、与任务闭包抽象,跟交通系统中的高铁很类似。
信息高铁不是WWW的下一代,是与WWW平行的构建在互联网之上的算力、算法、数据资产三者融合的信息智能加工底座。

基础设施化就是对需求的普及化和服务化。一是要能普及,人人都能用;二是要变成服务,服务化是基础设施的一个标志(云计算还不能说是完善的基础设施,因为它不能实现所有场景的服务化)。
在信息时代,要解决信息的获取、传输、存储、处理、显示全环节的基础设施化。工业时代实现的电报电话、广播电视,是数据传输的基础设施,进入信息时代后,互联网成为数据传输的全球信息基础设施,它之所以做到全球化,因为它有了标准化的IP包和路由器,有了标准化的光纤,相当于有了软硬两方面的高级抽象。但是这是数据层面上的互联互通,不是信息层面的,信息是有语义的数据,WWW定义了一个信息的全球共享机制,关键的标准化信息容器就是网页,有了这个高级抽象,就是实现了全球范围内的信息组织、访问、查找与推送。

进入到智能时代,需要实现算力网——也就是算力、算法与数据对象融合的基础设施化,其中数据对象借鉴了图灵奖获得者罗伯特-卡恩的digital object提法。信息时代,实现了以计算为中心的超算中心与网格,以数据为中心的数据中心与云计算中心,有了docker容器这样的标准化高级抽象,形成了算力站和算力网的雏形。

在智能时代,需要发展出全球算力基础设施(WWC),以算法为中心,用高效适配的多样性算力对数据资产进行深加工,产出模型。新型算力站是高通量中心,需要“联云成网”的技术。提出一个算力容器的抽象概念叫网程(grip),包含算力、算法与数据对象的融合,是分布式操作系统调度的最小单元,借鉴了进程(process)这个单机上的算力容器概念。

下图是智能时代互联网参考架构。
智能时代互联网参考架构

  • 互联网的最底层是数据通信网,5G/光纤/星网使得数据可以更广泛共享;
  • 上一层是互联网体系结构,IP网在这一层;(IP是不可撼动的吗)
  • 再往上的一层是实现信息全球共享的万维网(WWW),在这一层再平行地实现一个存储与处理共享(包含处理三要素算力、算法与数据对象)的算力网(WWC);
  • 最上面的应用层有消费互联网和产业互联网,其中消费互联网的核心是浏览器和几个超级App,产业互联网的核心是什么还不明确,可能是算力编排器和元宇宙等。

消费互联网实现了百业信息上网,产业互联网要实现千行模型上网。过去的信息技术侧重于赋能消费过程,未来的信息技术更侧重于赋能生产过程,我国跟发达国家相比,落后的也是生产过程的信息化。

当前的算力网还停留在研究异构多云统一调度的阶段,第三代算力网需要核心技术创新,至少应包括三方面:

  • 第一,需要对数据进行智能加工的新算力设备。
  • 第二,算力资源组织与算力使用的基础设施化
    • 从算力供给端来看,要做到不同地点、不同结构、不同权属的云化算力资源的统一以及互联互通,屏蔽掉硬件层、系统软件层、应用基础层的差异,支持供给与运营间的站网解耦;
    • 从算力消费端来看,使用体验要达到高通量(指高并发下在响应时间限制内的有效负载数)、低熵(超载时保持有序性)、计量精准三个要求,未来还要考虑绿电的政策与经济因素。
  • 第三,需要比当前的docker容器更高级的分布式算力抽象,及使用它们的算礼(computing protocol)标准。

算力网的分布式PRAM模型,有三个关键词即无缝§ +低熵(RA)+统一(M);

  • P要实现对智能任务的无缝编程,我们提出了更小粒度的任务闭包(task closure)算力容器,以及原子钟粒度的分布式时间确保的算礼协议,还提出几种新的智能编程范式——OODA、云函数和主干编程,力图做到算力、算法、数据对象的无缝解耦与灵活组合。
  • RA(Random Access)要保障算力网的低熵效率,我们提出低熵的DIP猜想,D是区分,I是隔离,P是优先,对应需要三个分布式技术,分布式标签用于区分,分布式控域用于隔离,分布式测调用于优先。
  • M强调统一,用互联网模式实现异构云在资源层的全球互联互通。
    对比

参考
https://ict.cas.cn/zjgd/202211/t20221114_6548082.html
http://www.ict.ac.cn/zjgd/202301/t20230104_6595094.html

  • 9
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值