【程序设计竞赛】C++与Java的细节优化

lcx_defender

已于 2024-04-17 17:31:19 修改

阅读量1.5k

点赞数 25

分类专栏：算法学习文章标签：算法

于 2024-02-12 23:09:57 首次发布

本文链接：https://blog.csdn.net/weixin_44581175/article/details/136103665

版权

算法学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文介绍了C++中提升输入/输出性能的优化策略，如取消std::ios::sync_with_stdio的同步、解除cin与cout的绑定、使用代替endl以及C++/Java的快速读写方法。同时讨论了一些不推荐的优化手段和注意事项。

摘要由CSDN通过智能技术生成

必须强调下，以下的任意一种优化，都应该是在本身采用的算法没有任何问题情况下的“锦上添花”，而不是“雪中送炭”。
如果下面的说法存在误导，请专业大佬评论指正

读写优化

C++读写优化——解除流绑定

在ACM里，经常出现数据集超大造成 cin TLE的情况，其实cin效率之所以低，不是比C低级，而是因为需要与scanf的缓冲区同步，导致效率降低，而且是C++为了兼容C而采取的保守措施。
C++代码中添加 ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);这一段之后，读取速度即可无限趋近于scanf和printf。
如果代码首部没有using namespace std; 则要换成std::ios::sync_with_stdio(0),std::cin.tie(0),std::cout.tie(0);

#include <bits/stdc++.h>
using namespace std;

int main()
{
	ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
	// 未使用using namespace std;时使用下方写法
	// std::ios::sync_with_stdio(0),std::cin.tie(0),std::cout.tie(0);
	// 代码主体读取、操作、打印
}

std::ios::sync_with_stdio(0)

在 C++ 中，取消同步流（std::ios::sync_with_stdio）是一个常用的技巧，用来加快输入/输出流（I/O）的速度。默认情况下，C++ 的标准库（iostream）与 C 的标准库（stdio）之间是同步的，这意味着它们共享缓冲区，并且每次使用其中一个库的 I/O 功能时，都会刷新另一个库的缓冲区。这保证了数据的一致性，但也增加了性能开销。

通过调用 std::ios::sync_with_stdio(0)，你可以取消这种同步，这通常会导致 I/O 操作的速度显著提高。但是，一旦取消了同步，就不能再混用 C++ 和 C 的 I/O 函数（如 cin/cout 和 scanf/printf），因为这可能会导致输出顺序不确定或其他问题。

如果已经采用了C++的输入函数cin,就避免再使用C的scanf；同样的如果已经使用 cout 就避免再使用 printf

cin.tie(0)

在默认的情况下cin绑定的是cout，每次执行的时候都要调用flush，这样会增加IO负担。
这行代码解除了 cin（输入流）与 cout（输出流）之间的绑定。默认情况下，cin 与 cout 绑定在一起，这意味着在每次从 cin 读取之前，cout 的缓冲区都会被自动刷新。通过解除绑定，可以进一步提高 I/O 性能，但这也意味着在输出和输入操作之间不再自动刷新 cout 的缓冲区。

cout.tie(0)

这行代码通常不是必须的，因为 cout 默认情况下并不绑定到其他流。它的主要作用是确保 cout 不与任何其他流（例如 cin 或 cerr）绑定。但在大多数情况下，这行代码并不会改变默认行为。

C++换行输出

endl会输出’\n’（\n是转义字符，代表换行），然后立即刷新缓冲区并输出到屏幕上。由于要刷新缓冲区，endl会比\n慢一点，一般不建议使用。以下是endl实现：

template <class _CharT, class _Traits>
inline _LIBCPP_INLINE_VISIBILITY
basic_ostream<_CharT, _Traits>&
endl(basic_ostream<_CharT, _Traits>& __os)
{
    __os.put(__os.widen('\n'));
    __os.flush();
    return __os;
}

C++中换行大多喜欢写 cout << endl;，然而据acmer和本人赛场亲身经历，这种写法比 cout << '\n; 输出速度要慢许多。当然这不乏出题人的原因，不过为了避免悲剧的发生希望大家还是使用如下两种方法。

在代码头部使用宏定义#define endl '\n' 替换endl
改掉使用endl的习惯

#include <bits/stdc++.h>
#define endl '\n'

int main()
{
	ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
	// 上方使用了宏定义,代码编译预处理阶段就将endl换成了'\n'
	cout << endl;
	// 直接输出'\n'
	cout << '\n';
}

C/C++自定义快读快写

本人没有亲自使用过，不过是看别人代码中有如此运用。据说C++17后getchar()/putchar()已经被负优化了，未知真假，个人选择使用。不过如果是需要开 __int128 的选手，这个快读快写恐怕还是得会，不过如果使用下方快读，千万记得不要关流，或者不要和 cin 混用。

using ll = __int128;

inline ll read()
{
   ll X=0,w=0; char ch=0;
   while(!isdigit(ch)) {w|=ch=='-';ch=getchar();}
   while(isdigit(ch)) X=(X<<3)+(X<<1)+(ch^48),ch=getchar();
   return w?-X:X;
}
inline void print(ll x)
{    
   if(x<0){putchar('-');x=-x;}
   if(x>9) print(x/10);
   putchar(x%10+'0');
}

Java快读快写

大部分初学Java的人应该是使用如下代码进行Java的读写，不过下面这个代码的读写，在面对大量数据的情况下是比较慢的。

import java.util.Scanner;

public class Main {
    public static void main(String[] args) {
    	// java.util 包下的读取
        Scanner sc = new Scanner(System.in);
        int n = sc.nextInt();
        // Java
        System.out.println(n);
        sc.close();
    }
}

下方的读写代码速度较快，经过实践检验，建议采用。该部分代码经过真实调试，应该是不存在什么问题。
特别提醒！！！如果使用了下方代码中的快速输出，代码最后必须使用out.flush(); 必须使用out.flush(); 必须使用out.flush();

快速读入的代码按需使用，写代码时不一定要全部写，如果在XCPC赛场上使用Java，可以提前写好该模板。

import java.io.*;

/**
 * 自定义快读类
 */
class Scanner {
    static StreamTokenizer st = new StreamTokenizer(new BufferedReader(new InputStreamReader(System.in)));
    // 字符串快速读入对象
    static BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
    public int nextInt() {
        try {
            st.nextToken();
            return (int) st.nval;
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }
    public double nextDouble() {
        try {
            st.nextToken();
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        return st.nval;
    }
    public float nextFloat() {
        try {
            st.nextToken();
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        return (float) st.nval;
    }
    public long nextLong() {
        try {
            st.nextToken();
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        return (long) st.nval;
    }
    public String next() {
        try {
            st.nextToken();
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        return st.sval;
    }
    // 按行读入字符串
    public String readLine() {
        String s = null;
        try {
            s = br.readLine();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return s;
    }
}
public class Main {
    // 快速输出对象
    static PrintWriter out = new PrintWriter(new BufferedWriter(new OutputStreamWriter(System.out)));
    public static void main(String[] args) {
        // 创建自定义的Scanner类
        Scanner sc = new Scanner();
        /**
         * 快读使用案例
         */
        int n = sc.nextInt();
        double d = sc.nextDouble();
        float f = sc.nextFloat();
        // 读入字符串(以空格、回车结尾)
        String str = sc.next();
        // 整行读入字符串(以回车换行结尾)
        String line = sc.readLine();

        /**
         * 快速输出使用案例
         */
        out.println(n);
        out.println(d);
        out.println(f);
        out.println(str);
        out.println(line);
        // 快速输出必须要刷新缓冲区,否则无法输出
        out.flush();
    }
}

读写样例
在这里插入图片描述

其他玄学优化——自行试用

下方玄学，只是部分传言，有些优化的效果似乎并不显著;有时不妨一试。

常用函数优化

inline int abs(int x)
{
	int y=x>>31;
	return (x+y)^y;
}
inline int max(int x,int y)
{
	int m=(x-y)>>31;
	return (y&m)|(x&~m);
}
inline int min(int x,int y)
{
	int m=(x-y)>>31;
	return (y&m|x&~m)^(x^y);
}
inline void swap(int &x,int &y)
{
	x^=y,y^=x,x^=y;
}
inline int ave(int x,int y)
{
	return (x&y)+((x^y)>>1);
}

变量自增

++i快于i++

用减法代替取模运算

把函数中的循环变量在整个函数开头用register统一定义好

频繁使用的数用register，和inline一个用法，只不过有可能把变量存入CPU寄存器，来减少时间;某些生命周期不重叠的变量合并，减少创建变量空间的时间。

int main()
{
    register int i;
    for (i = 1; i <= n; ++i)
    {
        // 逻辑部分
    }
    for (i = 1; i <= n; ++i)
    {
        // 逻辑部分
    }
    /*
        下方循环多次使用i
    */
}

减少使用STL，他们的常数特别大

现在大部分OJ平台都会自动开O2优化，所以可能STL常数问题可能也没那么严重，有时候也可以尝试手动开O2优化。据说有些时候可能会出现stl的map反而比自己手写map还快的情况…所以自己看情况吧

// 代码头部预处理指令手动打开O2
#pragma GCC optimize(2)

define比赋值更快

定义数组大小时尽量用奇数

尽量不要用bool,int型比bool快

if()else() 语句比三元运算符慢;但if语句比三元运算符快

学会合理使用位运算

判奇偶性：n&1相当于n%2==1。
交换变量x与y：

inline void swap(int &x,int &y)
{
	x^=y^=x^=y;
}