浅论 OI 中的卡常技巧（更新中）_oi竞赛动态内存-CSDN博客

本文链接：https://blog.csdn.net/weixin_48615166/article/details/129198010

文章探讨了在OI/ACM-ICPC等算法竞赛中的程序优化，特别是卡常数优化。除了底层常数优化，还包括输入/输出（I/O）的优化，如fread与cin的比较，以及输出时fputs的高效性。此外，文章还涉及变量类型的选取，switch-case与if-else的性能差异，位运算的作用，以及inline和register关键字的使用。文章指出，许多优化策略需谨慎使用，以免造成负优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

好像是八百年前的版本了，[新版](https://zhuanlan.zhihu.com/p/608989466)

绪言

何为“卡常”？

卡常数，又称底层常数优化，特指在OI/ ACM-ICPC等算法竞赛中针对程序基本操作进行的底层优化，一般在对程序性能要求较为严苛的题目或是在算法已经达到理论最优时间复杂度时使用，有时也用于非正解的强行优化。 ——百度百科

然鹅，本文讨论的卡常并不都是底层常数优化，还有一些比较“表面的”常数优化。

同时，本文参见“实用主义”，许多东西不能从底层说清楚（主要是我太菜了），只是说说怎么用。

本文尽量按照从易到难，从广泛到罕见的顺序。

一、I/O 优化

1.输入

没有什么可说的，非常简单，就是fread>read>scanf=cin（关同步）>cin（普通）

值得注意的是，关同步有一些不太好的特征。比如：


ios::sync_with_stdio(0);
cin.tie(0);
cout<<45<<' ';
cin>>a;
cout<<a<<' ';
printf("%lld ",a+6);
cout<<a+7<<' ';
printf("%lld ",a+8);

输入2，结果为 8 10 45 2 9。

这是因为 sync_with_stdio(0) 解绑了本身 c++ 为了防止 cout 和 printf 而制造的绑定，虽然加快了速度，但会使得 cout 晚于 printf 执行。

同时，cin.tie(0) 也解绑了 cin 和 cout ，使得必须 cin 执行结束后才能有 cout ，这在评测中无妨，但调试时候有个这东西就很难受。

因此，笔者的建议是，在有 printf 和 cout 时，或者在调试时，完全不要用这种读入优化。没必要的话，也不要用 cin.tie(0)。

对了，如果快读还嫌慢的话，又不会 fread ，可以在没有负数时删去快读的负数判定（其实没有什么意义但卡常本来不也没有什么意义吗（雾。

2.输出

输出比较友好的一点是，cout 就很快，多数时候甚至比快写快，基本上只比 puts 和 putchar 慢。

问题是怎么在不输出空格的前提下利用 puts 的高速的特点呢？ C++Reference告诉了我们答案：用 fputs 。

fputs("asdfghjkl",stdout)；

效率比 puts 还吓人。即使把那个 \n 补回来，还是比 puts 快。

经过一系列测试，发现 fputs 在一次输出 2 个字符时跟 putchar 差不多快，输出的字符越多优势越碾压。于是又有了一条建议：如果要一次输出多个字符串的，请合并输出。因为调用 fputs 这个操作本身很费时。fputs("abcdefghijklmnopqrstuvwxyz",stdout);的耗时在我的电脑上只有fputs("",stdout);的两倍。这一点也适用于 printf。

另外，cout<<endl; 比 cout<<'\n'; 慢很多，主要是第一个还要清缓存。