边缘计算盒是云边端架构和小系统管理的核心设备,是视觉AI落地的关键设备,也是物联网的节点设备,是人工智能应用绕不过去的核心。
当前边缘计算设备的技术路径有4种,分别是:CPU架构,GPU架构,ASIC架构,FPGA架构。每一种架构都有各自的特性,这些特性决定了他的优劣势。从性能,成本,功耗,灵活性和同构性这5个维度来看,我们可以用一个雷达图来呈现。
CPU有着极佳的同构性和灵活性,奈何性能太差,功耗太高,比较适合底层技术能力弱的,对性能要求不高的应用方向,视觉方向因为编解码计算量大,不是很适合。
GPU性能较强,灵活性和同构性也不错,功耗表现和成本表现一般,比较适合底层技术能力弱,对成本不敏感的应用方向。
FPGA各方面的综合表现比较平均,因为是可编辑的逻辑硬件,要求对硬件有很强的认知,而且当前FPGA的工程师生态相对比较差,落地上有相当的难度。
ASIC作为某个领域的专用芯片,有着绝佳的性能、低功耗和低成本表现,但是因为专用性,灵活性和同构性较差,当然作为某个领域的专业产品,灵活性和同构性并不是障碍,所以这个短板在专用领域不算短板,因此视觉方向的ASIC芯片,用在视觉 边缘计算领域变得顺理成章。
视觉ASIC的芯片领域合适用来做边缘计算的SOC如今已经非常丰富了,厂商比较多,海思、高通、MTK,amlogic等等,近两年寒武纪,地平线也加入了进来。要想把边缘计算盒做好,哪些因素需要去考虑呢?下面分享一点个人的看法:
一、成熟度,这里成熟度包括芯片的成熟度和开发工具的成熟度。
1、芯片成熟,代表着未来做出的产品的成熟度,判断芯片成熟度的方法有以下2个:
a、公司之前有没有推出过类似的成熟产品
b、芯片有没有客户成功量产的产品背书
2、开发工具的成熟度,代表着未来产品落地的成功概率和开发周期,判断方式同样是要看有没有公司成功短时间落地。
二、算力评估,因为是边缘端的设备,综合的算力是有限的,而且计算架构往往是浮点和定点结合的,所以算力是在特定计算架构下的算力。
三、模型的适配,ASIC架构的SOC核心是个NPU,因为计算架构和计算资源的原因,算法模型往往是要根据计算资源做相应的调整,这个对算法的适配有较高的要求。
四、芯片的接口能力和外设能力,边缘计算盒往细分行业用,需要结合行业的应用场景来,在细分行业中,边缘计算盒通常又充当了物联网网关的作用,接口和外设能力是细分应用领域不可缺少的一个考虑因素。
下面重点介绍一下,视觉AI领域常用的一些视觉SOC。
这几个SOC都是市场上比较常见,TX2的计算核心是GPU,有良好的通用性,算力和海思3559A相当,但是由于视频编解码都要消耗算力,所以综合算力是比3559A弱的。海思3559A有着优秀的同编同解的能力,做边缘计算的同时还能提供转码服务。
昇腾310是海思是一个比较大算力的芯片,有比较强的CPU和NPU算力,操作系统也比较友好,编码能力偏弱,单纯有算力要求的,可以选择它。
寒武纪220的各项规格都不错,缺点是功耗偏大,市场上见到的比较少。