一个sse2neon:https://github.com/DLTcollab/sse2neon
neon指令的使用介绍与范例:https://blog.csdn.net/EmSoftEn/article/details/51718763
这里提到了一些样例如yuvbgr转换,转置,矩阵相乘,以及寄存器分块, l1分块,可以进行仿照尝试:
可以查询手机处理器参数:https://nanoreview.net/en/soc-list/rating
看上去865应该是
l1 每个核都有32K+32K
l2 也是每个核独享,不过大小不一样
l3应该都是所有核共有一个缓存
处理器基本是这个模式?暂时没有更好的信息查询
https://www.7-cpu.com/cpu/Skylake.html