这两天在支持iphone方面的本地引擎集成工作,遇到了效率问题,iphone5上识别一句话要10多秒,经过打log验证时MLP模块矩阵乘法的效率太低,neon效果不好,百思不得其解。苹果不应该这样啊,想不通。
没办法,使用汇编语言来实现矩阵乘法,搞了两天,弄出来一个。结果最后发现之前竟然是Debug版本的,因此效率较低。等到换成Release版本的时候,效率问题迎刃而解。
擦。
这两天在支持iphone方面的本地引擎集成工作,遇到了效率问题,iphone5上识别一句话要10多秒,经过打log验证时MLP模块矩阵乘法的效率太低,neon效果不好,百思不得其解。苹果不应该这样啊,想不通。
没办法,使用汇编语言来实现矩阵乘法,搞了两天,弄出来一个。结果最后发现之前竟然是Debug版本的,因此效率较低。等到换成Release版本的时候,效率问题迎刃而解。
擦。