![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
高性能计算
文章平均质量分 98
EwenWanW
AI编译器 移动机器人 机器人视觉 VSLAM 深度学习 目标检测识别 自动化
展开
-
GPU CUDA编程1 存储器类型 数据交换 设备 共享数据 原子操作atomic 常量 纹理存储器 向量加法 点乘 矩阵乘法 事件计时 stream异步 排序 直方图
CUDA编程参考参考2参考3The CMake version of cuda_by_example CUDA Program:CUDA image rgb to gray;CUDA KLTCUDA 编程 加速 计算机视觉 !!!推荐CUDA存储器类型:每个线程拥有自己的 register寄存器 and loacal memory 局部内存每个线程块拥有一块 shared mem...原创 2018-12-27 22:23:31 · 766 阅读 · 0 评论 -
GPU CUDA编程2 opencv GPU 图像叠加 空间转换 阈值处理 直方图均衡化 变形 仿射变换 滤波器 腐蚀膨胀 边缘 特征 匹配 人脸检测 背景去除
opencv图像读取、显示、视频播放等 opencvGPU接口图像add、sub、颜色空间转换、阈值操作等1 opencv 图像读取#include <opencv2/opencv.hpp>#include <iostream>using namespace cv;using namespace std;int main(int argc, char** ar...原创 2018-12-28 19:39:18 · 2513 阅读 · 1 评论 -
cpp程序优化 嵌入式C/C++代码优化 C/C++代码优化具体方案
cpp程序优化C++编程优化——让你的代码飞起来 RGB格式的彩色图像先转换成黑白图像C/C++代码优化具体方案 c++ 性能优化策略1.关于继承:尽量少使用多重继承 不可否认良好的抽象设计可以让程序更清晰,代码更看起来更好,但是她也是有损失的,在继承体系中子类的创建会调用父类的构造函数, 销毁时会调用父类的析构函数,这种消耗会随着继承的深度直线上升,所以不要过度的抽象和继...原创 2019-02-10 13:16:12 · 1536 阅读 · 0 评论 -
ARM_NEON_CNN编程 SIMD单指令多数据流 intrinsics指令 内联汇编 CNN卷积网络优化 深度学习优化
ARM_NEON_CNN编程SIMD单指令多数据流 intrinsics指令 CNN卷积网络优化 深度学习优化本文github术语:System-on-Chip(SOC) 片上系统:核心、内存控制器、片上内存、外围设备、总线互连和其他逻辑(可能包括模拟或射频组件),以便产生系统。 SOC通常指集成度较高的设备,包括单个设备中系统的许多部分,可能包括模拟、混合信号或射频电路。专用集成电...原创 2019-04-30 11:55:22 · 6269 阅读 · 0 评论 -
GPU并行加速编程 opencl CUDA 核函数
GPU并行加速编程 opencl CUDA 核函数OpenCL(全称为Open Computing Langugae,开放运算语言)是第一个面向异构系统(此系统中可由CPU,GPU或其它类型的处理器架构组成)的并行编程的开放式标准。它是跨平台的。OpenCL由两部分组成,一是用于编写kernels(在OpenCL设备上运行的函数)的语言,二是用于定义并控制平台的API(函数)。OpenCL...原创 2019-07-07 15:58:01 · 4365 阅读 · 2 评论