C语言高效编程的的四大绝招 [转]

引言:

  编写高效简洁的C语言代码,是许多软件工程师追求的目标。本文就工作中的一些体会和经验做相关的阐述,不对的地方请各位指教。

  第一招:以空间换时间

  计算机程序中最大的矛盾是空间和时间的矛盾,那么,从这个角度出发逆向思维来考虑程序的效率问题,我们就有了解决问题的第1招--以空间换时间。

  例如:字符串的赋值。

  方法A:通常的办法:

#define LEN 32
char string1 [LEN];
memset (string1,0,LEN);
strcpy (string1,"This is a example!!");

  方法B:

const char string2[LEN] ="This is a example!";
char * cp;
cp = string2 ; 

  使用的时候可以直接用指针来操作。

  从上面的例子可以看出,A和B的效率是不能比的。在同样的存储空间下,B直接使用指针就可以操作了,而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频繁更改一个字符串内容的时候,A具有更好的灵活性;如果采用方法B,则需要预存许多字符串,虽然占用了大量的内存,但是获得了程序执行的高效率。

  如果系统的实时性要求很高,内存还有一些,那我推荐你使用该招数。该招数的变招--使用宏函数而不是函数。举例如下:

  方法C:

#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
int BIT_MASK(int __bf)
{
 return ((1U << (bw ## __bf)) - 1) << (bs ## __bf);
}
void SET_BITS(int __dst, int __bf, int __val)
{
 __dst = ((__dst) & ~(BIT_MASK(__bf))) | /
 (((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))
}

SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);

  方法D:

#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
#define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)
#define BIT_MASK(__bf) (((1U << (bw ## __bf)) - 1) << (bs ## __bf))
#define SET_BITS(__dst, __bf, __val) /
((__dst) = ((__dst) & ~(BIT_MASK(__bf))) | /
(((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))

SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);

  函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。大家要知道的是,函数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语句对当前栈进行检查;同时,CPU也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,函数调用需要一些CPU时间。而宏函数不存在这个问题。宏函数仅仅作为预先写好的代码嵌入到当前程序,不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。

  D方法是我看到的最好的置位操作函数,是ARM公司源码的一部分,在短短的三行内实现了很多功能,几乎涵盖了所有的位操作功能。C方法是其变体,其中滋味还需大家仔细体会。

  第二招:数学方法解决问题

  现在我们演绎高效C语言编写的第二招--采用数学方法来解决问题。数学是计算机之母,没有数学的依据和基础,就没有计算机的发展,所以在编写程序的时候,采用一些数学方法会对程序的执行效率有数量级的提高。举例如下,求 1~100的和。

  方法E

int I , j;
for (I = 1 ;I<=100; I ++)
{
 j += I;
}

  方法F

int I;
I = (100 * (1+100)) / 2

  这个例子是我印象最深的一个数学用例,是我的计算机启蒙老师考我的。当时我只有小学三年级,可惜我当时不知道用公式 N×(N+1)/ 2 来解决这个问题。方法E循环了100次才解决问题,也就是说最少用了100个赋值,100个判断,200个加法(I和j);而方法F仅仅用了1个加法,1次乘法,1次除法。效果自然不言而喻。所以,现在我在编程序的时候,更多的是动脑筋找规律,最大限度地发挥数学的威力来提高程序运行的效率。
  第三招:使用位操作

  实现高效的C语言编写的第三招——使用位操作。减少除法和取模的运算。在计算机程序中,数据的位是可以操作的最小数据单位,理论上可以用"位运算"来完成所有的运算和操作。一般的位操作是用来控制硬件的,或者做数据变换使用,但是,灵活的位操作可以有效地提高程序运行的效率。举例如下:

  方法G

int I,J;
I = 257 /8;
J = 456 % 32;

  方法H

int I,J;
I = 257 >>3;
J = 456 - (456 >> 4 << 4);

  在字面上好像H比G麻烦了好多,但是,仔细查看产生的汇编代码就会明白,方法G调用了基本的取模函数和除法函数,既有函数调用,还有很多汇编代码和寄存器参与运算;而方法H则仅仅是几句相关的汇编,代码更简洁,效率更高。当然,由于编译器的不同,可能效率的差距不大,但是,以我目前遇到的MS C ,ARM C 来看,效率的差距还是不小。相关汇编代码就不在这里列举了。

  运用这招需要注意的是,因为CPU的不同而产生的问题。比如说,在PC上用这招编写的程序,并在PC上调试通过,在移植到一个16位机平台上的时候,可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。

  第四招:汇编嵌入

  高效C语言编程的必杀技,第四招——嵌入汇编。"在熟悉汇编语言的人眼里,C语言编写的程序都是垃圾"。这种说法虽然偏激了一些,但是却有它的道理。汇编语言是效率最高的计算机语言,但是,不可能靠着它来写一个操作系统吧?所以,为了获得程序的高效率,我们只好采用变通的方法 --嵌入汇编,混合编程。举例如下,将数组一赋值给数组二,要求每一字节都相符。

char string1[1024],string2[1024];

  方法I

int I;
for (I =0 ;I<1024;I++)
 *(string2 + I) = *(string1 + I)

  方法J

#ifdef _PC_
int I;
for (I =0 ;I<1024;I++)
*(string2 + I) = *(string1 + I);
#else
#ifdef _ARM_
__asm
{
 MOV R0,string1
 MOV R1,string2
 MOV R2,#0
loop:
 LDMIA R0!, [R3-R11]
 STMIA R1!, [R3-R11]
 ADD R2,R2,#8
 CMP R2, #400
 BNE loop
}
#endif

  方法I是最常见的方法,使用了1024次循环;方法J则根据平台不同做了区分,在ARM平台下,用嵌入汇编仅用128次循环就完成了同样的操作。这里有朋友会说,为什么不用标准的内存拷贝函数呢?这是因为在源数据里可能含有数据为0的字节,这样的话,标准库函数会提前结束而不会完成我们要求的操作。这个例程典型应用于LCD数据的拷贝过程。根据不同的CPU,熟练使用相应的嵌入汇编,可以大大提高程序执行的效率。

  虽然是必杀技,但是如果轻易使用会付出惨重的代价。这是因为,使用了嵌入汇编,便限制了程序的可移植性,使程序在不同平台移植的过程中,卧虎藏龙,险象环生!同时该招数也与现代软件工程的思想相违背,只有在迫不得已的情况下才可以采用。切记,切记。

  使用C语言进行高效率编程,我的体会仅此而已。在此以本文抛砖引玉,还请各位高手共同切磋。希望各位能给出更好的方法,大家一起提高我们的编程技巧。

阅读更多

C语言高效编程四大绝招(转)

02-13

编写高效简洁的C语言代码,是许多软件工程师追求的目标。本文就是针对编程工作中的一些体会和经验做相关的阐述。rnrn  第一招:以空间换时间rnrn  计算机程序中最大的矛盾是空间和时间的矛盾,那么,从这个角度出发逆向思维来考虑程序的效率问题,我们就有了解决问题的第1招--以空间换时间。比如说字符串的赋值:rnrn  方法A:通常的办法rnrn  _NOBR> _CODE>#define LEN 32rn  char string1 [LEN];rn  memset (string1,0,LEN);rn  strcpy (string1,"This is a example!!");_CODE>rn  rn  _NOBR>rnrn  方法B:rnrn  _NOBR> _CODE>const char string2[LEN] ="This is a example!";rn  char * cp;rn  cp = string2 ;_CODE>rn  rn  _NOBR>rnrn  使用的时候可以直接用指针来操作。 rnrn  从上面的例子可以看出,A和B的效率是不能比的。在同样的存储空间下,B直接使用指针就可以操作了,而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频繁更改一个字符串内容的时候,A具有更好的灵活性;如果采用方法B,则需要预存许多字符串,虽然占用了大量的内存,但是获得了程序执行的高效率。 rnrn  如果系统的实时性要求很高,内存还有一些,那我推荐你使用该招数。该招数的变招--使用宏函数而不是函数。举例如下: rnrn  方法C:rnrn  _NOBR> _CODE>#define bwMCDR2_ADDRESS 4rn  #define bsMCDR2_ADDRESS 17rn  int BIT_MASK(int __bf) rn  rn  return ((1U << (bw ## __bf)) - 1)rn  << (bs ## __bf);rn  rn  void SET_BITS(int __dst, rn  int __bf, int __val)rn  rn  __dst = ((__dst) & ~(BIT_MASK(__bf))) |rn  rn  (((__val) << (bs ## __bf)) rn  & (BIT_MASK(__bf))))rn  rnrn  SET_BITS(MCDR2, MCDR2_ADDRESS,rn  RegisterNumber);_CODE>rn  rn  _NOBR>rn方法D: rnrn  _NOBR> _CODE>#define bwMCDR2_ADDRESS 4rn  #define bsMCDR2_ADDRESS 17rn  #define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)rn  #define BIT_MASK(__bf) rn  (((1U << (bw ## __bf)) - 1)rn  << (bs ## __bf))rn  #define SET_BITS(__dst, __bf, __val)rn  rn  ((__dst) = ((__dst) & ~(BIT_MASK(__bf)))rn  | rn  (((__val) << (bs ## __bf))rn  & (BIT_MASK(__bf))))rnrn  SET_BITS(MCDR2, MCDR2_ADDRESS,rn  RegisterNumber);_CODE>rn  rn  _NOBR>rnrn  函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。大家要知道的是,函数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语句对当前栈进行检查;同时,CPU也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,函数调用需要一些CPU时间。 rnrn  而宏函数不存在这个问题。宏函数仅仅作为预先写好的代码嵌入到当前程序,不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。 rnrn  D方法是我看到的最好的置位操作函数,是ARM公司源码的一部分,在短短的三行内实现了很多功能,几乎涵盖了所有的位操作功能。C方法是其变体,其中滋味还需大家仔细体会。 rn  rn  第二招:数学方法解决问题rnrn  现在我们演绎高效C语言编写的第二招--采用数学方法来解决问题。数学是计算机之母,没有数学的依据和基础,就没有计算机的发展,所以在编写程序的时候,采用一些数学方法会对程序的执行效率有数量级的提高。举例如下,求 1~100的和。rnrn  方法E:rnrn  _NOBR> _CODE>int I , j;rn  for (I = 1 ;I<=100; I ++)rn  rn  j += I;rn  _CODE>rn  rn  _NOBR>rnrn  方法Frnrn  _NOBR> _CODE>int I;rn  I = (100 * (1+100)) / 2_CODE>rn  rn  _NOBR>rnrn  这个例子是我印象最深的一个数学用例,是我的计算机启蒙老师考我的。当时我只有小学三年级,可惜我当时不知道用公式 N×(N+1)/ 2 来解决这个问题。方法E循环了100次才解决问题,也就是说最少用了100个赋值,100个判断,200个加法(I和j);而方法F仅仅用了1个加法,1次乘法,1次除法。效果自然不言而喻。所以,现在我在编程序的时候,更多的是动脑筋找规律,最大限度地发挥数学的威力来提高程序运行的效率。rn第三招:使用位操作 rnrn  实现高效的C语言编写的第三招——使用位操作。减少除法和取模的运算。在计算机程序中数据的位是可以操作的最小数据单位,理论上可以用"位运算"来完成所有的运算和操作。一般的位操作是用来控制硬件的,或者做数据变换使用,但是,灵活的位操作可以有效地提高程序运行的效率。举例如下:rnrn  方法G rnrn  _NOBR> _CODE>int I,J;rn  I = 257 /8;rn  J = 456 % 32;_CODE>rn  rn  _NOBR>rnrn  方法Hrnrn  _NOBR> _CODE>int I,J;rn  I = 257 >>3;rn  J = 456 - (456 >> 4 << 4);_CODE>rn  rn  _NOBR>rnrn  在字面上好像H比G麻烦了好多,但是,仔细查看产生的汇编代码就会明白,方法G调用了基本的取模函数和除法函数,既有函数调用,还有很多汇编代码和寄存器参与运算;而方法H则仅仅是几句相关的汇编,代码更简洁,效率更高。当然,由于编译器的不同,可能效率的差距不大,但是,以我目前遇到的MS C ,ARM C 来看,效率的差距还是不小。相关汇编代码就不在这里列举了。 rnrn  运用这招需要注意的是,因为CPU的不同而产生的问题。比如说,在PC上用这招编写的程序,并在PC上调试通过,在移植到一个16位机平台上的时候,可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。rn 第四招:汇编嵌入 rnrn  高效C语言编程的必杀技,第四招——嵌入汇编。"在熟悉汇编语言的人眼里,C语言编写的程序都是垃圾"。这种说法虽然偏激了一些,但是却有它的道理。汇编语言是效率最高的计算机语言,但是,不可能靠着它来写一个操作系统吧?所以,为了获得程序的高效率,我们只好采用变通的方法--嵌入汇编,混合编程。举例如下,将数组一赋值给数组二,要求每一字节都相符。 rnrn  _NOBR> _CODE>char string1[1024],string2[1024];_CODE>rn  rn  _NOBR>rnrn  方法I rnrn  _NOBR> _CODE>int I;rn  for (I =0 ;I<1024;I++)rn  *(string2 + I) = *(string1 + I)_CODE>rn  rn  _NOBR>rnrn  方法J rnrn  _NOBR> _CODE>#ifdef _PC_rn  int I;rn  for (I =0 ;I<1024;I++)rn  *(string2 + I) = *(string1 + I);rn  #elsern  #ifdef _ARM_rn  __asmrn   rn  MOV R0,string1rn  MOV R1,string2rn  MOV R2,#0rn  loop:rn  LDMIA R0!, [R3-R11]rn  STMIA R1!, [R3-R11]rn  ADD R2,R2,#8rn  CMP R2, #400rn  BNE looprn  rn  #endif_CODE>rn  rn  _NOBR>rnrn  方法I是最常见的方法,使用了1024次循环;方法J则根据平台不同做了区分,在ARM平台下,用嵌入汇编仅用128次循环就完成了同样的操作。这里有朋友会说,为什么不用标准的内存拷贝函数呢?这是因为在源数据里可能含有数据为0的字节,这样的话,标准库函数会提前结束而不会完成我们要求的操作。这个例程典型应用于LCD数据的拷贝过程。根据不同的CPU,熟练使用相应的嵌入汇编,可以大大提高程序执行的效率。 rnrn  虽然是必杀技,但是如果轻易使用会付出惨重的代价。这是因为,使用了嵌入汇编,便限制了程序的可移植性,使程序在不同平台移植的过程中,卧虎藏龙,险象环生!同时该招数也与现代软件工程的思想相违背,只有在迫不得已的情况下才可以采用。 rnrnrnrnhttp://tech.china.com/zh_cn/netschool/programme/c/656/20050909/12643095.htmlrnrnrnrn

学习散分:C语言高效编程四大绝招

12-27

编写高效简洁的C语言代码,是许多软件工程师追求的目标。本文就是针对编程工作中的一些体会和经验做相关的阐述。rnrn  第一招:以空间换时间rnrn  计算机程序中最大的矛盾是空间和时间的矛盾,那么,从这个角度出发逆向思维来考虑程序的效率问题,我们就有了解决问题的第1招--以空间换时间。比如说字符串的赋值:rnrn  方法A:通常的办法 rn#define LEN 32rnchar string1 [LEN];rnmemset (string1,0,LEN);rnstrcpy (string1,"This is a example!!"); rnrnrn  方法B: rnconst char string2[LEN] ="This is a example!";rnchar * cp;rncp = string2 ; rnrnrn  使用的时候可以直接用指针来操作。rnrn  从上面的例子可以看出,A和B的效率是不能比的。在同样的存储空间下,B直接使用指针就可以操作了,而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频繁更改一个字符串内容的时候,A具有更好的灵活性;如果采用方法B,则需要预存许多字符串,虽然占用了大量的内存,但是获得了程序执行的高效率。rnrn  如果系统的实时性要求很高,内存还有一些,那我推荐你使用该招数。该招数的变招--使用宏函数而不是函数。举例如下:rnrn  方法C: rn#define bwMCDR2_ADDRESS 4rn#define bsMCDR2_ADDRESS 17rnint BIT_MASK(int __bf)rnrn return ((1U << (bw ## __bf)) - 1)<< (bs ## __bf);rnrnvoid SET_BITS(int __dst,rnint __bf, int __val)rnrn __dst = ((__dst) & ~(BIT_MASK(__bf))) |rn\rn (((__val) << (bs ## __bf))rn& (BIT_MASK(__bf))))rnrnrnSET_BITS(MCDR2, MCDR2_ADDRESS,RegisterNumber); rnrnrn  方法D: rn#define bwMCDR2_ADDRESS 4rn#define bsMCDR2_ADDRESS 17rn#define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)rn#define BIT_MASK(__bf)rn(((1U << (bw ## __bf)) - 1)rn<< (bs ## __bf))rn#define SET_BITS(__dst, __bf, __val)rn\rn((__dst) = ((__dst) & ~(BIT_MASK(__bf)))rn| \rn(((__val) << (bs ## __bf))rn& (BIT_MASK(__bf))))rnrnSET_BITS(MCDR2, MCDR2_ADDRESS,rnRegisterNumber); rnrnrn  函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。大家要知道的是,函数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语句对当前栈进行检查;同时,CPU也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,函数调用需要一些CPU时间。rnrn  而宏函数不存在这个问题。宏函数仅仅作为预先写好的代码嵌入到当前程序,不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。rnrn  D方法是我看到的最好的置位操作函数,是ARM公司源码的一部分,在短短的三行内实现了很多功能,几乎涵盖了所有的位操作功能。C方法是其变体,其中滋味还需大家仔细体会。 rn第二招:数学方法解决问题rnrn  现在我们演绎高效C语言编写的第二招--采用数学方法来解决问题。数学是计算机之母,没有数学的依据和基础,就没有计算机的发展,所以在编写程序的时候,采用一些数学方法会对程序的执行效率有数量级的提高。举例如下,求 1~100的和。rnrn  方法E: rnint I , j;rnfor (I = 1 ;I<=100; I ++)rnrn j += I;rn rnrnrn  方法F rnint I;rnI = (100 * (1+100)) / 2 rnrnrn  这个例子是我印象最深的一个数学用例,是我的计算机启蒙老师考我的。当时我只有小学三年级,可惜我当时不知道用公式 N×(N+1)/ 2 来解决这个问题。方法E循环了100次才解决问题,也就是说最少用了100个赋值,100个判断,200个加法(I和j);而方法F仅仅用了1个加法,1次乘法,1次除法。效果自然不言而喻。所以,现在我在编程序的时候,更多的是动脑筋找规律,最大限度地发挥数学的威力来提高程序运行的效率。rnrn  第三招:使用位操作rnrn  实现高效的C语言编写的第三招——使用位操作。减少除法和取模的运算。在计算机程序中数据的位是可以操作的最小数据单位,理论上可以用"位运算"来完成所有的运算和操作。一般的位操作是用来控制硬件的,或者做数据变换使用,但是,灵活的位操作可以有效地提高程序运行的效率。举例如下:rnrn  方法G rnint I,J;rnI = 257 /8;rnJ = 456 % 32; rnrnrn  方法H rnint I,J;rnI = 257 >>3;rnJ = 456 - (456 >> 4 << 4); rnrnrn  在字面上好像H比G麻烦了好多,但是,仔细查看产生的汇编代码就会明白,方法G调用了基本的取模函数和除法函数,既有函数调用,还有很多汇编代码和寄存器参与运算;而方法H则仅仅是几句相关的汇编,代码更简洁,效率更高。当然,由于编译器的不同,可能效率的差距不大,但是,以我目前遇到的MS C ,ARM C 来看,效率的差距还是不小。相关汇编代码就不在这里列举了。rnrn  运用这招需要注意的是,因为CPU的不同而产生的问题。比如说,在PC上用这招编写的程序,并在PC上调试通过,在移植到一个16位机平台上的时候,可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。rnrn  第四招:汇编嵌入rnrn  高效C语言编程的必杀技,第四招——嵌入汇编。"在熟悉汇编语言的人眼里,C语言编写的程序都是垃圾"。这种说法虽然偏激了一些,但是却有它的道理。汇编语言是效率最高的计算机语言,但是,不可能靠着它来写一个操作系统吧?所以,为了获得程序的高效率,我们只好采用变通的方法--嵌入汇编,混合编程。举例如下,将数组一赋值给数组二,要求每一字节都相符。 rnchar string1[1024],string2[1024]; rnrnrn  方法I rnint I;rnfor (I =0 ;I<1024;I++)rn *(string2 + I) = *(string1 + I) rnrnrn  方法J rn#ifdef _PC_rnint I;rnfor (I =0 ;I<1024;I++)rn*(string2 + I) = *(string1 + I);rn#elsern#ifdef _ARM_rn__asmrnrn MOV R0,string1rn MOV R1,string2rn MOV R2,#0rnloop:rn LDMIA R0!, [R3-R11]rn STMIA R1!, [R3-R11]rn ADD R2,R2,#8rn CMP R2, #400rn BNE looprnrn#endif rnrnrn  方法I是最常见的方法,使用了1024次循环;方法J则根据平台不同做了区分,在ARM平台下,用嵌入汇编仅用128次循环就完成了同样的操作。这里有朋友会说,为什么不用标准的内存拷贝函数呢?这是因为在源数据里可能含有数据为0的字节,这样的话,标准库函数会提前结束而不会完成我们要求的操作。这个例程典型应用于LCD数据的拷贝过程。根据不同的CPU,熟练使用相应的嵌入汇编,可以大大提高程序执行的效率。rnrn  虽然是必杀技,但是如果轻易使用会付出惨重的代价。这是因为,使用了嵌入汇编,便限制了程序的可移植性,使程序在不同平台移植的过程中,卧虎藏龙,险象环生!同时该招数也与现代软件工程的思想相违背,只有在迫不得已的情况下才可以采用。 rnrn 转:http://www.uml.org.cn/c%2B%2B/200602235.htm

没有更多推荐了,返回首页