团队软件库_CPU怎么建软件生态

4db6e296-e311-eb11-8da9-e4434bdf6706.png

近期,关于芯片的话题特别的火热,虽然我不是芯片设计从业人员,但是一直做高性能计算软件库的工作,也领导和维护了开源矩阵计算库OpenBLAS,经常会和各种芯片和IP公司打交道。我的浅见是,芯片做出来可能只是第一步,培养起相应的软件生态,或者说融入主流的软件生态,才是决定这个芯片ISA/架构能走多远。

今天是第一篇,聊聊CPU公司建软件生态的事情。

为什么第一篇写CPU的生态,而不是GPU、AI加速卡等的软件生态呢?因为我觉得CPU支持的应用范围更广,对生态的需求更大,所以先写这个。

CPU公司的软件生态我认为分为两个层次,一个是面向开发者,一个是面向应用者。

开发环境与Runtime

软件开发者是芯片公司非常重要的资产,CPU做出来是不够的,要让更多的软件开发者用这颗芯片才是成功。国际大厂们都有一只较大的软件团队,在做面向开发者的软件工具和SDK等。

对于一颗CPU来说,以下是必备选项:

  • 编译工具链,以及相应的调试工具和模拟器等。一般来说,移植GCC或者LLVM等,支持C/C++语言,增加针对本CPU的后端代码生成等。如果是有特殊扩展指令,向量化指令等,最好提供Intrinsic函数接口,方便C语言的调用。
  • OS操作系统,主要以Linux为主。如果是面向台式机,服务器等,需要支持一个完整的Linux发行版。Linux Kernel部分由芯片公司负责,Linux发行版的其他部分可以和操作系统公司合作。如果是嵌入式系统,需要选择支持那种系统,是嵌入式Linux,还是Android,或者其他的实时系统等。嵌入式的场景比较多,支持哪种系统和最后的芯片定位有关系。
  • 核心软件库。比如,这颗芯片将来做HPC等计算类任务,就需要有BLAS,FFT等软件库。如果做计算机视觉类应用,需要有OpenCV库。如果是跑人工智能,需要有DNN库等。(p.s. 有需求可以找我们,高性能核心软件库,我们是国内最好的团队)

以上只是一些基础必要性的工作,下面这些是成为一家主流的CPU公司需要持续做的:

  • 更多的主流编程语言的支持,比如说支持Java,优化jvm的执行效率等。
  • 更多的开发工具,比如性能分析工具,IDE等。这部分有一些公司在做相应的产品,比如专门的程序分析工具等。
  • 持续的优化和改进。不管是编译工具链,OS,还是库,或者各种Benchmark等,都需要持续的迭代优化,进一步发挥硬件的性能。同时,给下一代的芯片设计进行反馈。这是一项长期坚持的工作,通过长期的投入,保证拉开与竞争对手的差距。

如果目标是成为国际大厂,那么需要做的:

  • 积极参与开源社区,贡献开源项目。不管是资助开源社区,还是培养社区里面的核心开发者,对于芯片公司来说,都是非常重要的事情。而且,不只是开源项目简单的移植,还要针对这个CPU架构做优化。这个工作量就非常大了,需要联合很多的小伙伴一起做。
  • 建立开发者社区,提供课程,案例,大学计划,比赛等。积累应用案例,教程,办各种的线上/线下讨论会,去大学推广/联合实验室,搞编程比赛等等。国际大厂在这方便做的确实不错,各种资料和文档获取的很方便,一站式解决。
  • 推一套编程语言/框架。随着芯片架构复杂程度的提高,异构要怎么解决?是否有生产率更高的编程模型等等。比如,Intel最近在推的oneAPI

应用框架与软件

面向应用层的框架与软件非常的多,可能每个应用领域都会是一套相对独立的系统,例如,人工智能,大数据系统,HPC,办公Office系统,各种Web服务,嵌入式系统等。

根据CPU的设计规划,明确主要的应用领域。根据应用领域去梳理重要的框架与软件。比如,人工智能场景,推理和训练的框架。HPC场景,MPI,PETSc等解法器。电子办公场景,Office系统和数据库等。

联合开源社区,操作系统公司或者ISV软件公司,做这些应用框架和软件的移植与优化。又是一个大工作量的事情,而且要根据场景一个个做下去。

针对一些重点行业场景,提供软硬件的参考设计方案,支持和培养一批方案厂商,以服务行业。根据行业的反馈,进行应用框架或者开发环境的迭代。

如果是RISC-V生态?

当前,x86的生态最成熟的,ARM的生态在嵌入式和手机市场很成熟,但是在服务器市场稍弱。RISC-V作为一种开放指令集架构,虽然当前生态还不够成熟,但是我个人是看好RISC-V生态发展,在全球市场上有潜力在未来几年成为有力竞争者之一。

从RISC-V IP和芯片来说,国内外已经有多家RISC-V的IP和芯片公司,涵盖了从MCU,嵌入式到服务器等多种产品形态,也有针对AI市场的RISC-V+NPU或者众核的芯片出现。在ISA指令集上,RISC-V可以通过基金会,制定标准,制定基础的指令集,制定扩展的指令集,也给各芯片公司留下了定制化指令的空间。

RISC-V软件生态当前的现状是,以开源社区为基础推进,主要是开发环境层次的生态。比如,各家芯片公司对于Linux Kernel,GCC,LLVM社区的贡献等。部分学校或者研究机构,对于一些开源项目进行了RISC-V移植。比如,有UC Berkeley的人员对OpenBLAS项目在RISC-V架构做了简单移植,但是还没有进行任何的优化(优化是和芯片微架构密切相关的)。Fedora等Linux发行版已经可以支持RISC-V 64位的体系结构。

目前RISC-V已经具备基础的开发工具和环境,作为一名Geek,是可以玩得起来的。有了编译工具链,有模拟器,是可以做开发和移植的。此外,市面上也有一些低成本的板卡(RISC-V芯片 或者 FPGA跑RISC-V软核),可以做一些上板的开发和测试。产品层面的应用,随着今年RISC-V芯片的增多,会越来越多。

在RISC-V芯片开始逐渐增多后,软件生态可做的事情会越来越多:

  • 继续推动开源项目和社区对RISC-V的支持。各家RISC-V公司相比国际大厂还是弱小的,完全靠自己走一套独立的生态不够现实,也失去了RISC-V开放指令集的意义。所以,核心的开发环境还是依靠开源项目和社区协作。各芯片厂商,研究机构,操作系统厂商,软件生态厂商互相配合,有人出人,有钱出钱,持续的移植和优化开源项目。也许,有的厂商会说我等着就可以了,反正有别人做,到时候用开源社区的现成成果就可以。但很可能的结果是,只是能用,但效率较低,一样造成芯片竞争力低。
  • 开发者社区、大学计划、比赛等。国内的几家RISC-V IP公司都在推大学计划,相信陆续会出现一批RISC-V相关的选修课。比赛上,之前国际上办过RISC-V软核设计比赛。也许将来RISC-V的芯片多了之后,可以做一个编程比赛,或者黑客马拉松等。
  • 应用场景,应用框架和软件等。目前,RISC-V接受程度比较高的是嵌入式、IoT等。这种场景的生态需求比台式机、服务器要简单一些。核心是做出有差异化的软硬件方案,要不然是替代已有市场的产品,性能更高,价格更低;要不然就是先一步满足新兴的场景/产品需求(比如AIIoT等)。RISC-V市场应用的成功,只靠开源软件社区是不现实的,必须芯片厂商和方案商共同的推动才能尽快的落地。

以上只是我的不成熟小看法,软件生态是个可大可小的事情,如果只是瞄准个细分专用领域,那么生态投入就会少很多,但这样是否能养活一家CPU公司,能否活得够好?如果将来是参与全球竞争,面向多种领域,那么生态投入就会比较大。这不是一家芯片公司自己能做完的事情,保持开放心态,与各种软硬件厂商,社区积极协作,持续推动发展,才能见到成效。

与各位一起努力

http://weixin.qq.com/r/wzpDW0jEQBU-rQw492-R (二维码自动识别)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值