![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DM642
文章平均质量分 63
ciompmq
一个新手
展开
-
dsk6711线性汇编奇怪的问题(去掉一条存储指令能快10倍)
发信人: admireO (新学期新形象), 信区: DSPTech 我的数据处理完后,在算法循环里有一条指令:|| STW .D2T1 ImgRet,*DestAddr--存储数据到内部RAM中,我用的是两层循环,外部1024次,内部256次。现在的问题是,如果我的算法注释掉这条存储指令,时间上要提高10倍!!仔细考虑了一下,两者的差别不可能有这么大,不知道是怎么转载 2008-07-20 16:46:00 · 894 阅读 · 0 评论 -
TI-DM642优化相关
TI-DM642优化相关(ZZ)2007-04-06 11:08工作阶段:工作流程一般分为三个阶段。 阶段一:直接按照需要用C语言实现功能。在实际的DSP应用中,许多算法都是非常复杂,直接用汇编代码编写,虽然优化效率很高,可是实现的难度却很大,所以一般都采用先用C语言来实现,然后编译运行,利用C64X开发环境的profile clock工具测试程序运行转载 2008-08-01 10:30:00 · 676 阅读 · 0 评论 -
C64X DSP EDMA/QDMA小结
C64X DSP EDMA/QDMA小结2007-04-09 11:341)EDMA概要 ①EDMA数据传输有两种发起方式:ü CPU发起的EMDA数据传输(非同步方式):需要传输时,CPU设置ESR寄存器的相应位为1,从而触发一个EDMA事件的产生,事件对应的通道参数被送往地址硬件并且完成相应的处理,这种非同步方式的实时数据传输无需设定EE转载 2008-08-01 10:57:00 · 1059 阅读 · 0 评论 -
基于TMS320C64x/DM64x的视频编码优化
基于TMS320C64x/DM64x的视频编码优化(ZZ)2007-04-06 10:59TMS320C64x/DM64x器件建立在德州仪器(TI)开发的第二代高性能VLIW架构(VelociTI.2)基础之上。该器件具有VLIW架构、2级存储器/高速缓存层次结构以及EDMA引擎等关键特性,从而使其成为计算强度较大的视频/影像应用(如视频编码与分析)的最佳选择之一转载 2008-08-01 10:33:00 · 838 阅读 · 0 评论 -
C6000的参数传递规则
0推荐C6000系列DSPC62和67系列有A0~A15,B0~B15共32个寄存器,对于C64XX,有A0~A31,B0~B31共64个寄存器1、C62XX可用于条件寄存器有A1、A2、B0、B1、B2,对于C64XX来说,还可以使用A0;2、C6000的C编译器规定函数调用的前10个入口参数使用寄存器A4、B4、A6、B6、A8、B8、A10、B转载 2008-07-25 14:53:00 · 1124 阅读 · 0 评论 -
关于6446的,对以后有参考价值
最近经常和一些业内朋友探讨DM6446开发的相关问题,现在不涉及个人以及公司项目秘密的情况下,摘录一些对大家开发DM6446或许有用的信息,罗列如下,如有纰漏,还请大家拍砖!~~Q:DVSDK是否必须?A:不是。如果你有正版CCS,则依然可以凑齐DSP-Side的开发工具链Q:DMA必须要CSL库嘛?A:不是,不同于DM642,操作Cache和DMA必须要CSL库,DM6446是转载 2008-07-25 15:04:00 · 1064 阅读 · 0 评论 -
终于写成自己的第一个线性汇编小程序
自己的程序中有一个地方需要short开方尝试写了个线性汇编一开始20多个错误后来没错了也显示不正确仔细查一遍原来是MVK和ADDK用混了终于能正常显示了但是耗费时间比C还多看来还是没有掌握啊小高兴一把继续努力原创 2008-07-22 14:05:00 · 741 阅读 · 0 评论 -
从dct简单了解一种线性汇编优化方法
一直在看这方面的东西,自己也写过代码,但是始终都没有掌握其中的真谛。其实现在也是半懂不懂,然而还是感觉有些灵感了,写起代码也不那么慢了。今天下午就调试了四个代码,前提是这四个函数前几天是看过的:dct4x4dc,idct4x4dc,quant4x4dc和iquant4x4dc。效果dct变换还是很好的,基本提高了一半的效率,而iquant就没甚么改进,而且quant还不如以前了,原因估计是代转载 2008-07-20 16:31:00 · 672 阅读 · 0 评论 -
在DSP 线性汇编中可否调用C函数,如何调用
求助: 在DSP 线性汇编中可否调用C函数,如何调用?例子:原始C函数(经过简化)如下:short compute(const short *x, int n){int i; sum = 0;for (i=0;isum = sum + x[i]*x[i];}return sum/n; }除法函数如下;short divi_compute(int a, short b){ return转载 2008-07-20 17:02:00 · 2445 阅读 · 0 评论 -
线性汇编经验总结
发信人: giantice (大冰块!), 信区: DSPTech标 题: 线性汇编经验总结发信站: 水木社区 (Mon Sep 11 22:47:20 2006), 站内在C64上编了一些线性汇编,总结了一些经验贴出来,多多指教。线性汇编经验总结: 1. 一般只是对有循环结构的代码编写汇编替代,非循环代码不需要流水,性能提高不大 2. 为形成软件流水,循环体不要转载 2008-07-20 16:07:00 · 2933 阅读 · 1 评论 -
线性汇编问题:找不到_main函数的入口地址
线性汇编问题:找不到_main函数的入口地址 我将线性汇编的函数写到.sa文件中,然后在.c中的main()调用该函数,但是编译报错,如下:undefinedfirst referencedsymbolin file-------------------------_mainc:/ti/c6000/cgtools/lib/rts640转载 2008-07-20 16:25:00 · 1733 阅读 · 0 评论 -
线性汇编随记
1.在线性汇编中是可以加入"||"的,虽然TI文档里说在线性汇编里并行指令是非法,如果加入位置正确的话,是可以提高速度的2.在没有编排流水而将循环展开,有时候得到的性能比不采用循环展开,由CCS软件流水的性能要好.(特别是对于循环次数少如4次的情况3.不需要指定功能单元,寄存器组,交叉通道.分配哪个寄存器, 即如使用LDNDW .D1T2 A_s1,中转载 2008-07-20 15:53:00 · 6943 阅读 · 0 评论 -
C6000的线性汇编
优化过程:•优化根据程序剖分结果,把占用运行时间较多的模块进行优化,优化到代码能够有效的满 足需要•三阶段:–分析和设计C代码–利用硬件平台信息优化C代码–汇编优化线性汇编与汇编不同:不需要考虑汇编的功能单元的使用、寄存器的分配、指令是否并行以及流水线的延迟,因而不用安排软件流水;线性汇编格式.global __functio转载 2008-07-20 15:34:00 · 17276 阅读 · 0 评论 -
TI C64X 视频处理应用编程重点内容提示
TI C64X 视频处理应用编程重点内容提示2007-04-06 13:48C64X用于作视频处理的比较多,初学的话需要看的内容也比较多,归纳一下吧:(1)数据传输:EDMA/QDMA、中断向量表配置;(2)内存分配:L2SRAM,包括cmd文件配置、内存映射等,片外内存;(3)硬件接口:McBSP、HPI、VP、GPIO、PCI;(4)编程库:D转载 2008-08-01 10:36:00 · 713 阅读 · 0 评论