编程优化与常见错误

最新推荐文章于 2019-05-04 13:02:05 发布

wangqianqianya

最新推荐文章于 2019-05-04 13:02:05 发布

阅读量305

点赞数

分类专栏： acm 文章标签： oj

本文链接：https://blog.csdn.net/wangqianqianya/article/details/80670784

版权

acm 专栏收录该内容

106 篇文章 0 订阅

订阅专栏

Runtime error

一般为数组越界，开大一点

或主函数中局部变量数组内存过大，导致栈溢出a[1000][1000],改为全局变量

关于浮点数大整数什么要求原样输出问题

用string puts,gets等转换成字符输入输出！

一行输出多个数的时候行末不能输出多余空格，平台会判成格式错误

long long

看到题目数据较大就直接用long long（2^63）int 最多到十位（有的编译器会比较小）

一维数组最多开八位

所以二维数组开到1000左右

超时问题（1s计算1~2000万次）

二重循环能算n到2000，而三重到200

ios::sync_with_stdio(false)

取消cin与stdin同步 cin会更快但注意之后别和scanf混用可能会出现混乱

cin慢是有原因的，其实默认的时候，cin与stdin(标准输入，即从键盘输入，scanf)总是保持同步的，也就是说这两种方法可以混用，而不必担心文件指针混乱，同时cout和stdout也一样，两者混用不会输出顺序错乱。正因为这个兼容性的特性，导致cin有许多额外的开销，如何禁用这个特性呢？只需一个语句std::ios::sync_with_stdio(false);，这样就可以取消cin于stdin的同步了。

cin，cout之所以效率低，是因为先把要输出的东西存入缓冲区，再输出，导致效率降低，而这段语句可以来打消iostream的输入输出缓存，可以节省许多时间，使效率与scanf与printf相差无几

std::ios::sync_with_stdio(false);
std::cin.tie(0);//解除cin与cout的绑定，效率更快

输入输出很多时用scanf,printf

如1e18,用cin,cout会超时

有的题目没说遇EOF结束，只说有多个输入数据可能要加scanf（）！=EOF，否则超时

优化

1、优化代码框架

个人觉得代码架构对性能的影响至关重要，就好骨架之于人，所以我把这个放在第一点。举个简单的例子：

优化前：

void main()
{
	while (isDone)
	{
		DoSomething1();
 
		DoSomething2();
	}
}
 
void DoSomething1()
{
	....;
}
 
void DoSomething2()
{
	....;
	
	if (...)
	{
		isDone = True;
	}
}

优化后：

void main()
{
	DoSomething1();
}
 
void DoSomething1()
{
	while (isDone)
	{
		....;
 
		DoSomething2();
	}
}
 
void DoSomething2()
{
	....;
 
	if (...)
	{
		isDone = True;
	}
}

优化前频繁的调用DoSomething1()和DoSomething2()，需要被调用函数频繁的入栈出栈，开销很大，可以合理的优化代码结构，减少函数调用层次和嵌套深度，甚至有些函数可以使用内联或define来定义，以减少函数调用所占时间。当然不能破坏程序的美观和可读性，要跟性能之间做一个平衡。

2、简化函数

1）充分理解函数所要实现的功能，用最简单的方式去实现，去掉冗余的逻辑。

2）优化循环，有些操作可以放到循环外做，不必每次都做

3、选取合适的算法和数据结构

选取合适的数据结构很重要，通常使用指针比数组要快很多；对于频繁插入删除的操作，使用链表要比使用数组快很多。一般使用指针比使用数组索引快。

使用数组：

for (int i = 0; i < len; i++)
{
A = array[i];
}

使用指针：

p = array;
for (int i = 0; i < len; i++)
{
A = *p++;
}

4、减少运算强度

1）尽量使用位操作代替计算

a = a * 8;
a = a / 8;
a = a % 8;

修改成

a = a << 3;
a = a >> 3;
a = a & 0x7;

2 ）公共子表达式可以提前计算

c = a + b;
d = a + b + e;
f = a + b + g;

优化成：

c = a + b;
d = c + e;
f = c + g;

3）通过查表来换取时间

4）前缀改成后缀， i++改成++i

5、利用操作系统和CPU本身的优势

1）充分利用操作系统的位宽，尤其是拷贝等操作上，但这个地方要注意字节对齐

char *a, *b;
...
for ( ; ; )
{
*a = *b;
a++;
b++;
}

假设操作系统64位，可优化成

for ( ; ; )
{
(long long *)a = (long long *)b;
a = a + 8;
b = b + 8;
}

2）充分利于CPU的流水

利用CPU的流水来做并行计算，比如：

for (int i = 0; i < len; i++)
{
sum += a[i];
}

优化后：

for (int i = 0; i < len; i = i + 4)
{
sum1 += a[i];
sum2 += a[i + 1];
sum3 += a[i + 2];
sum4 += a[i + 3];
}
sum + sum1 + sum2 + sum3 + sum4;

6、采用编译选项-O2

开启编译选项-O2，不仅会对代码的分支、常量、表达式进行优化，还会尝试更多寄存器和指令级的优化，编译期间会占用更多的内存和编译时间，但对于运行效率会有很大提升。当然也会带来一些麻烦，它会改变代码结构，比如对对分支的合并和消除，对公用子表达式的消除，对循环内load/store操作的替换和更改等，都会使目标代码的执行顺序变得面目全非，导致调试信息严重不足。

输入_第一类：输入不说明有多少个Input Block,以EOF为结束标志。

C语法：
while(scanf("%d %d",&a, &b) != EOF)
{ .... }

C++语法：
while( cin >> a >> b )
{ .... }

说明：

Scanf函数返回值就是读出的变量个数，如：scanf( “%d %d”, &a, &b ); 如果只有一个整数输入，返回值是1，如果有两个整数输入，返回值是2，如果一个都没有，则返回值是-1。

EOF是一个预定义的常量，等于-1。

输入_第二类：输入一开始就会说有N个Input Block,下面接着是N个Input Block。

C语法：
scanf("%d",&n) ;
for( i=0 ; i<n ; i++ )
{ .... }

C++语法：
cin >> n;
for( i=0 ; i<n ; i++ )
{ .... }

输入_第三类：输入不说明有多少个Input Block,但以某个特殊输入为结束标志。

C语法：
while(scanf("%d",&n) && n!=0 )
{ .... }
 C++语法：
while( cin >> n && n != 0 )
{ .... }

输入_第四类：输入是一整行的字符串的

#include <stdio.h>
 #include <string.h>
 int main(void){
 int i;
 char a[15],b[205];
   while(1){
 gets(a);
 if(strcmp(a,"ENDOFINPUT")==0) 
 break;
 gets(b);
 gets(a);
   for(i=0;b[i]!='\0';i++){
   if(b[i]>=65&&b[i]<=90){
   b[i]-=5;
   if(b[i]<65) b[i]+=26;
   }
 printf("%c",b[i]);
 }
 printf("\n");
 }
 return 0;
 }
   while(1){
 gets(a);
 if(strcmp(a,"ENDOFINPUT")==0) 
 break;
 gets(b);
 gets(a);
   for(i=0;b[i]!='\0';i++){
   if(b[i]>=65&&b[i]<=90){
   b[i]-=5;
   if(b[i]<65) b[i]+=26;
   }
 printf("%c",b[i]);
 }
 printf("\n");
 }
 return 0;
 }

C语法：
char buf[20];
gets(buf);

C++语法：
如果用string buf;来保存：getline( cin , buf );

如果用char buf[ 255 ]; 来保存：cin.getline( buf, 255 );

wangqianqianya

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
编程优化与常见错误

Runtime error一般为数组越界，开大一点或主函数中局部变量数组内存过大，导致栈溢出a[1000][1000],改为全局变量关于浮点数大整数什么要求原样输出问题用string puts,gets等转换成字符输入输出！一行输出多个数的时候行末不能输出多余空格，平台会判成格式错误long long看到题目数据较大就直接用long long（2^63）int 最...
复制链接

扫一扫