DSP
Mars_WH
微信:75582029 欢迎交流。从事图像深度学习相关开发,主方向:目标检测分割、模型压缩、引擎优化,常用语言:C++、Python,常用框架:Caffe、Pytorch、TensorFlow,常用技术:CUDA、TensorRT、TVM、Boost,常用系统:Linux、Windows,常用IDE:CLion、PyCharm、VS,常用编译工具:CMake、GCC,常用硬件:Jetson TX1/2,Tesla P4,海思Hi3559A,昇腾310,比特大陆BM1682
展开
-
MCSDK(TI-DSP多核软件开发套件)安装配置
CCS5.4.0.00091_win32+bios_mcsdk_02_01_02_06_setupwin32,安装(这里不重点,自己到网上下载对应的破解版以及相应的MCSDK)好后,在discover product时,NDK添加不了,需要下载最新的NDK包,放入C:\ti目录,就OK了安装失败主要是组件与CCS5.4不匹配造成ndk 2.12.02.43 and ndk 2.22原创 2015-04-13 07:28:54 · 7649 阅读 · 6 评论 -
TI DSP TMS320C66x学习笔记之TI官方读BMP程序(一)
好了,现在进入今天的主题,TI官方提供的源代码---读BMP图像。可以从多核开发套件的图像处理demo文件夹C:\ti\mcsdk_2_01_02_06\demos\image_processing中导入工程,读BMP图像主要是两个文件mcip_bmp_utils.c和mcip_bmp_utils.h,我的代码也是“拿来主义”,大部分与TI源代码相同,只修改部分,以适用自己的需求,期间对代码进行了详细注释,大家可以参考下,理清思路。原创 2015-11-10 16:04:59 · 4220 阅读 · 13 评论 -
TI DSP TMS320C66x学习笔记之通用并行端口uPP(二)
这是翻译TI官方文档《KeyStone Architecture Universal Parallel Port (uPP)》SPRUHG9有关通用并行端口uPP的内容(除寄存器部分),寄存器部分大家可以自己看,现在手头上正在做uPP与FPGA的图像数据通信。等程序调通了,会贴出部分来分享一下开发与调试经验。转载请注明出处:http://blog.csdn.net/hw5226349/原创 2015-11-14 17:09:18 · 9612 阅读 · 1 评论 -
TI DSP TMS320C66x学习笔记之算法运算时间测量(五)
介绍两种最常用的针对TI CCS平台DSP开发过程中,算法运行时间测量的方法。一种是在带SYS/BIOS系统的项目中使用比较方便,一种是不带系统裸机程序中使用。两个测量时间的方式精度都是一个cycle,如果CPU频率为1GHz,则一个cycle为10纳秒。只不过处理成毫秒ms,再低意义不大。当然CCS中还自带profile性能分析器来查看运行时钟/周期数,还可以用C标准库提供的time.h。都是可原创 2016-01-19 15:44:54 · 5677 阅读 · 2 评论 -
TI DSP TMS320C66x学习笔记之VLIB测试数据(三)
VLIB是TI提供的针对C6x优化过的视觉库,下载地址:http://software-dl.ti.com/libs/vlib/latest/index_FDS.html提供40多个核心函数,主要实现以下功能:Background Modeling & SubtractionObject Feature ExtractionTracking & RecognitionLow-lev原创 2015-12-27 11:08:19 · 4747 阅读 · 1 评论 -
TI DSP TMS320C66x学习笔记之TI Imglib库相关函数(四)
图像分析一、本节提供的函数描述,通常应用于图像分析应用。图像边界和周长函数Boundary and perimetercomputation functions are provided as commonly-used structural operators invision applications.IMG_boundary_8IMG_boundary_16sIM原创 2015-12-31 17:49:56 · 8391 阅读 · 3 评论 -
TI DSP TMS320C66x学习笔记之内联指令(c6x.h中文注释)(六)
/*****************************************************************************//* C6X.H v7.4.12 *//***************************************原创 2016-02-24 15:41:57 · 16302 阅读 · 1 评论 -
TI DSP TMS320C66x学习笔记之SPI Nor Flash多核程序烧写(七)
烧写工具链接: https://pan.baidu.com/s/1em4jWjbskpMmNd1uzscjjA 提取码: 82qg经过一段时间的研究终于把TMS320C6657单核和双核的SPI Nor Flash的程序烧写调通了。工具都是前辈的工作,有需要的可以留下邮箱,我有空可以发。原理参考钱丰的《TI c66x 系列DSP 多核BOOT 的研究》论文。通过Nor flas...原创 2016-02-29 18:53:20 · 14121 阅读 · 36 评论 -
TI DSP TMS320C66x学习笔记之DSP优化经验(八-1)
为了实现循环的pipeline。我们需要把循环体进行拆分,拆分时要考虑以下几点: (1)、拆分成几个循环比较合适?在各个循环能pipeline的前提下,拆开的循环个数越少越好。这就要求尽可能让各个循环的运算量接近。 (2)考虑在什么地方把程序拆开比较合适?循环体里的数据流往往并不是单一的,在拆开的断点处势必要用中间变量保存上次的循环运算结果,供以后的循环用。适当的拆开循环体,使所需的中间变量越少越好。 (3)循环体中的函数调用必须定义成内嵌形式,含有函数调用的循环系统是无法使之pipeline的原创 2016-05-03 17:16:13 · 11356 阅读 · 3 评论