移动端深度学习
文章平均质量分 91
koibiki
这个作者很懒,什么都没留下…
展开
-
CnnDroid 优化加速原理
原文链接:GPU-based Acceleration of Deep Convolutional Neural Networks on Mobile Platformsgithub地址:CNNDroid1.前置知识 移动GPU架构现在的移动GPU一般由多个平行计算单元SC(shader core)组成。每个SC又由多个平行算数逻辑单元ALU(arithmetic and logic unit)组...原创 2018-05-15 19:22:34 · 1033 阅读 · 0 评论 -
在Android端使用OpenGL的compute shader加速计算
compute shader的介绍和使用参看博客使用compute shader进行通用计算及示例在Android端使用compute shader需要OpenGL ES3.1,即Android5.1以上的平台。可能是oples的原因,在Android上使用compute shader有几个注意要点:生成texture时不能使用glTexIamge2D, 需使用glTexStorage2D,然后使...原创 2018-06-06 14:41:37 · 7931 阅读 · 2 评论 -
在Android使用opengles实现Winograd卷积算法
测试用数据输入:卷积核为:padding为SAME使用opengles的imageArray存储输入输出数据,纹理格式为rgba16f,为将纹理坐标与输入矩阵坐标一一对应,所以需要先将输入进行补零操作。先将输入矩阵拉平为一个一维向量,再对这个一维向量每个数字后补3个零,然后传入到一个5x5的gl纹理上,这样纹理坐标就与输入坐标一一对应了。对卷积核先做预计算,然后将卷积预...原创 2018-10-12 11:59:27 · 2641 阅读 · 0 评论 -
在Android端实现基于OPENGL ES 的深度学习前向传播框架
github项目地址首先感谢夕阳叹大神提供的思路,大家先可以去https://blog.csdn.net/jxt1234and2010/article/details/71056736看看,基本把实现的流程都说了一遍,我照着思路实现了一下,同时参考了一下CnnDroid。这个项目断断续续写了快4个月了,最近忙起来了,可能没什么时间完善了,先用blog记录一下思路,要有机会再完善了。目前...原创 2018-10-12 16:49:07 · 1741 阅读 · 0 评论