智能手机和平板电脑兴起之后,英国厂商ARM凭借多种处理器和图形核心IP授权占据了这块市场的绝大多数份额。但ARM也不是一直在场独角戏,和该公司差不多同龄的MIPS同样做的是RISC处理器的授权业务。之前MIPS凭借向Broadcom(博通)和Sigma Designs等授权已经将手伸向了家用娱乐/机顶盒等网络领域。随着ARM的兴起,MIPS也逐渐在向迅速增长的移动/平板领域扩张。
当地时间5月10日,MIPS正式发布了新的处理器IP核心家族——Aptiv系列。和ARM的Cortex类似,Aptiv系列产品涵盖高端至低端所有范围,并且瞄准的市场和提供的性能均和ARM同级产品类似,这宣告着MIPS正式进军处理器IP授权的战斗号角吹响。
此前MIPS最近的IP核心发布日期为2010年9月——MIPS 1074K系列。从那时至今,ARM已经官方发布了Cortex-A15和Cortex-A7(比较奇葩的是ARM宣布Cortex-A15是在TI发表内置这款核心的OMAP 5之后)以及Cortex-A5和Cortex-M4四款产品。Aptiv系列的三个成员基本与其一对一针锋相对。
性能评价方面,MIPS表示目前的标准DMIPS/MHz/核心数量可信度不高。该公司表示CoreMark更能客观评价核心的运算能力,而 MIPS产品在其中具有比ARM更高的性能。CoreMark主要通过测试读/写混合操作以及整数运算等性能,程序使用简洁的ANSI C代码编写,在x86机器上通过gcc编译大小不超过16K。著名网站Anandtech表示,MIPS对于CoreMark的偏好有一定道理,毕竟它能更好反映L1缓存以及预读取的性能。但目前由于没有Cortex-A15的CoreMark数据,因此仍旧采用DMIPS/MHz进行比较。
MIPS发布的Aptiv系列总共包括三款处理器——ProAptiv、interAptiv和microAptiv,其中前两者可选择多核配置,最大核心数量proAptiv为6,interAptiv为4。而最低端的microAptiv均为单核心。
以下三张表格有助于对比MIPS和ARM两者全系列产品的性能,注意这里主要根据命名即产商自己给予的定位分类,而不是实际性能排序。其中Cortex-A系列对应MIPS proAptiv,Cortex-R系列对应interAptiv,Cortex-M系列对应microAptiv。
MIPS
与
ARM
高端产品线核心性能对比
| ||
MIPS
|
DMIPS/MHz/Core
|
ARM
|
proAptiv
|
3.5
|
Cortex-A15
|
2.5
|
Cortex-A9
| |
1074K
|
2.03
| |
74K
|
2.0
|
Cortex-A8
|
1.9
|
Cortex-A7
| |
1.57
|
Cortex-A5
| |
M24K
|
1.46
| |
1.24
|
ARM11
| |
1.14
|
ARM9
|
虽然MIPS将interAptiv定位于Cortex-A5/A7/A9的竞争对手,但根据其内部缓存ECC支持等一些特性,将其和Cortex-R系列性能对比更好一些,两者官方的市场定位倒是相同——无线基带以及汽车安全/传动系控制等应用。
MIPS
与
ARM
中端产品线核心性能对比
| ||
MIPS
|
DMIPS/MHz/Core
|
ARM
|
2.5
|
Cortex-R7
| |
interAptiv
|
1.7
| |
1.66
|
Cortex-R5
| |
34K
|
1.62
|
Cortex-R4
|
1004K
|
1.5
| |
24K
|
1.46
|
而在微控制器核心领域,MIPS microAptiv系列的对手是ARM Cortex-M系列。
MIPS
与
ARM
微控制器核心性能对比
| ||
MIPS
|
DMIPS/MHz/Core
|
ARM
|
microAptiv
|
1.56
| |
M14K
|
1.5
| |
M4K
|
1.3
| |
1.25
|
Cortex-M3/M4
| |
0.9
|
Cortex-M0
| |
0.8
|
Cortex-M1
|
下面让我们来总览MIPS此次新发布的处理器一些架构细节:
proAptiv架构总览
proAptiv处理器家族可拥有1-6个物理核心,每个核心的面积均为标准Cortex-A15的一半。 想必围观群众已经有人表示惊叹,但做到这一点也不是完全不可能,此前业内已经有部分人士觉得ARM Cortex-A15的面积比起其标称的性能是大了点。MIPS对Anandtech表示,由于ARM对于Cortex-A15的具体规格没有严格规定,所以面积值只是估计。一半面积的比值是在移去Cortex-A15中NEON的面积值之后得来,并且MIPS proAptiv中类似模块32bit SIMD引擎(DSP ASE)非可选部分而是必定集成。
每个proAptiv核心都是一颗超标量(superscalar)架构并支持乱序执行的CPU,单周期可进行4条整数以及2条浮点操作。多重级别TLB(页表缓冲)的应用以及支路缓存/预测的改进使得proAptiv对比上代1074K系列性能提高超过60%。而FPU部分具有dual-issue特性,运行频率和CPU相同。
proAptiv和interAptiv家族还引入了EVA(Extended Virtual Addressing,扩展虚拟化寻址)技术用来更好地管理可用空间。类似于Cortex-A15,这些IP具备一个coherence manager以及整合的L2缓存控制器并支持ECC。不同之处是Cortex-A15的设计极限支持32核心,而proAptiv家族最多支持6个。有意思的部分是proAptiv的Coherent Processing System(CPS)可根据负载控制各个核心的电压/频率等,类似于ARM在Cortex-A15中引入的big.LITTLE大小核心节能策略。但有一点不同:Cortex-A15中的节能状态运行核心是2个低功耗的Cortex-A7,抑或TI在OMAP 5中使用的Cortex-M4。而MIPS的proAptiv家族由于每个核心都能在超低电压/频率下工作,因此节能核心就是其自身,并且每个核心的面积也小于Cortex-A15。
架构对比
| ||||
MIPS proAptiv
|
ARM Cortex-A9
|
高通
Krait
|
ARM Cortex-A15
| |
Decode
|
3-wide
|
2-wide
|
3-wide
|
3-wide
|
流水线深度
|
13级
|
8级
|
11级
|
15级
|
乱序执行
|
支持
|
支持
|
支持
|
支持
|
管线化FPU
|
有
|
有
|
有
|
有
|
多媒体处理引擎
|
32bit DSP ASE
|
可选64bit MPE
|
128bit NEON
|
可选128bit MPE
|
制程工艺
|
40nm/28nm
|
40nm/32nm
|
28nm
|
28nm
|
典型运行频率
|
1.2GHz
|
1.2GHz
|
1.5GHz
|
2.5GHz
|
对于嵌入式应用,proAptiv的着重点是对于功耗的敏感性,此时proAptiv的最大运行频率预计只有1.5GHz左右。Anandtech称根据MIPS的最新表态,1.2GHz的典型运行频率是在台积电40nm工艺的最差情况下取得。如采用同样的28nm HP/G制程,proAptiv与Cortex-A15的极限频率相当,均为2.0-2.5GHz。
interAptiv与microAptiv架构总览
interAptiv产品家族最大的特点是支持超线程——目前ARM还没有一款产品引入超线程技术。随着采用Intel Medfield Atom产品的智能设备上市,引入超线程技术对于目前日常使用的负载下性能的提升可谓非常有利。
MIPS称3个interAptiv核心的性能表现类似或略微超过2个Cortex-A9/3个Cortex-A5核心,核心面积综合三者也大致相当。当然MIPS着重宣传的CoreMark测试分数interAptiv肯定占优势。而interAptiv家族产品中CPU执行管线为多个线程所共享,可减轻内存访问延迟对于性能的冲击程度。
MIPS将进程解释为VPE(Virtual Processing Elements),interAptiv核心的流水线深度为9级,不支持乱序执行。而支持多线程的IEEE 754标准FPU为可选项,具体厂商/用户可根据自己需求定制。此外DSP ASE多媒体处理引擎以及EVA扩展寻址技术也同样为可选模块。节能技术部分interAptiv和proAptiv同样应用CPS系统。但与 proAptiv对比,interAptiv核心架构的节能技术更进一步,核心可以在低负载下完全关闭:频率降为0并且L1指令+数据缓存可在此时智能选择,而proAptiv只能智能选择L1指令缓存。
如使用台积电40nm G工艺制造,interAptiv产品家族最高频率可达1GHz并附带一切模块和超线程功能,如放弃超线程功能中的硬件调度部分频率可达1.2GHz,最后如果去掉多媒体处理引擎频率可冲至1.5GHz。MIPS表示这些参考值为“甜点”频率,此时功耗比处于最佳状态。当然这仅仅是授权标准,实际产品如何取舍由用户自行选择。
而应用于工业微控制领域最底端的microAptiv系列产品为此前M14k/c的“软件优化”版,支持microMIPS代码压缩。由于整合了DSP ASE引擎,信号处理可在更低成本下完成。
这种5级流水线的架构核心频率在65nm LP制程下最高可达400MHz,MIPS同时给出了和Cortex-M4的对比:
当然,对比Cortex-M4多出来一堆特性面积上肯定也要更大:在90nm LP制程工艺的条件下,ARM给出的数据是Cortex-M4的面积为0.17平方毫米,而无缓存版microAptiv MCU的面积为0.42平方毫米。但MIPS对Anandtech称上述数据非同条件对比,在90nm LP工艺面积优化过后microAptiv只比Cortex-M4面积大0.01平方毫米。总之这点公说公有理婆说婆有理,不管大多少反正只要有附加特性肯定得用多余的面积来换。
杂谈与总结
MIPS于2010年9月发布了1074K系列处理器,直到现在也只有一家厂商推出了实际的产品。虽然有不少家签署了IP授权协议,但基于 1074K的SoC处理器仅此一款——eSilicon去年宣布基于GlobalFoundries 28nm制程工艺的1074K产品流片完成,但离最终产品上市还至少有两年的时间。这一点对于ARM也是同样,Cortex-A15早在2011年2月就已宣布,实际产品上市要等到2013年初。
虽然高端的proAptic核心能带来和Cortex-A15相当的性能,但不得不遗憾地说MIPS的参与实在有点晚了,来晚的参与者如果没有带来性能上的优势那就会成为劣势。幸运的是,MIPS产品的整体功耗更低,和ARM产品面向的市场有一些不同。但更大的劣势在于市场中和MIPS签署授权协议的厂商过少,不过由于两大巨头高通和博通均具有授权,在这个移动设备飞速发展的时代它们可能会利用MIPS产品填补ARM的空缺。(编者按:其实对于龙芯也同样是一个机遇)
尽管Google同样也把目光投向了MIPS,近期Android NDK更新后用新版开发工具做出的程序不会再在MIPS平台出现兼容性问题而无法运行。但夹在ARM与x86两大阵营之间的MIPS显然空间并不是太大,MIPS最好的方法就是不要放弃并继续耕耘市场,推出更高性能的核心和尝试打入中低端智能手机/平板电脑市场就是一个好手段。幸运的是,君正这个MIPS的合作伙伴正在不断努力,还联合艾诺推出了全球首款Android 4.0平板电脑。
不管怎么说,这次发布的新proAptiv系列产品对于用户还是有几个亮点的,特别是在家用网络设备和机顶盒领域。这些地方本来就是MIPS而非 ARM的强项,而proAptiv的不俗性能也增加了MIPS进军消费级市场的底气。此外interAptiv和microAptiv系列对比ARM的定位相当产品性能具有优势:interAptiv具有超线程技术,microAptiv具有集成的强力DSP引擎。在开拓新市场方面两者具有不小的优势。
预计proAptiv和interAptiv系列核心将于2012年中期开始进入正式生产阶段,而microAptiv现在就可进行生产。MIPS已经与多家厂商结成了战略合作关系以推广自家IP和技术,并推动SoC的研发速度。我们将继续关注基于MIPS架构SoC处理器的进展方向,希望其能尽快拿出实物。