C++火车头优化


火车头:将下面的代码加在头文件前即可

#pragma GCC optimize(3)
#pragma GCC target("avx")
#pragma GCC optimize("Ofast")
#pragma GCC optimize("inline")
#pragma GCC optimize("-fgcse")
#pragma GCC optimize("-fgcse-lm")
#pragma GCC optimize("-fipa-sra")
#pragma GCC optimize("-ftree-pre")
#pragma GCC optimize("-ftree-vrp")
#pragma GCC optimize("-fpeephole2")
#pragma GCC optimize("-ffast-math")
#pragma GCC optimize("-fsched-spec")
#pragma GCC optimize("unroll-loops")
#pragma GCC optimize("-falign-jumps")
#pragma GCC optimize("-falign-loops")
#pragma GCC optimize("-falign-labels")
#pragma GCC optimize("-fdevirtualize")
#pragma GCC optimize("-fcaller-saves")
#pragma GCC optimize("-fcrossjumping")
#pragma GCC optimize("-fthread-jumps")
#pragma GCC optimize("-funroll-loops")
#pragma GCC optimize("-fwhole-program")
#pragma GCC optimize("-freorder-blocks")
#pragma GCC optimize("-fschedule-insns")
#pragma GCC optimize("inline-functions")
#pragma GCC optimize("-ftree-tail-merge")
#pragma GCC optimize("-fschedule-insns2")
#pragma GCC optimize("-fstrict-aliasing")
#pragma GCC optimize("-fstrict-overflow")
#pragma GCC optimize("-falign-functions")
#pragma GCC optimize("-fcse-skip-blocks")
#pragma GCC optimize("-fcse-follow-jumps")
#pragma GCC optimize("-fsched-interblock")
#pragma GCC optimize("-fpartial-inlining")
#pragma GCC optimize("no-stack-protector")
#pragma GCC optimize("-freorder-functions")
#pragma GCC optimize("-findirect-inlining")
#pragma GCC optimize("-fhoist-adjacent-loads")
#pragma GCC optimize("-frerun-cse-after-loop")
#pragma GCC optimize("inline-small-functions")
#pragma GCC optimize("-finline-small-functions")
#pragma GCC optimize("-ftree-switch-conversion")
#pragma GCC optimize("-foptimize-sibling-calls")
#pragma GCC optimize("-fexpensive-optimizations")
#pragma GCC optimize("-funsafe-loop-optimizations")
#pragma GCC optimize("inline-functions-called-once")
#pragma GCC optimize("-fdelete-null-pointer-checks")
#pragma GCC optimize(2)

另外,在有些地方您不能加火车头,您还可做这些优化:

1.将标准输入输出(cin与cout)改为格式化输入输出(scanf与printf),或者优化标准输入输出(即在主函数内第首行加入如下代码):

ios::sync_with_stdio(false);
cin.tie(0);
cout.tie(0);

2.运算符优化:比如将a%2改为a&1,将a*2改为a<<1等等
而且如果您在面试的时候写代码写成这样,可能会让面试官直呼牛逼
3.变量优化,尽量在循环外定义变量;比如这段代码:

string s;
cin >> s;
for (int i = 0; i < s.size(); ++ i ) {
	int a;
	cin >> a;
	cout << s[i] << ' ' << a << endl;
}

可以改成这样:

string s;
cin >> s;
int a, len = s.size();
for (int i = 0; i < len; ++ i ) {
	cin >> a;
	cout << s[i] << ' ' << a << endl;
}

4.玄学优化

  • 把endl换成’\n’
  • 把i++,j++等写成++i,++j

5.快读快写
我常用的:

inline int read() {
	int x = 0, f = 1;
	char ch = getchar();
	while (ch < '0' || ch > '9') {
		if (ch == '-') f = -1;
		ch = getchar();
	}
	while (ch >= '0' && ch <= '9') x = x * 10 + ch - '0', ch = getchar();
	return x * f;
}
void write(int x) {
	if (x < 0) putchar('-'), x = -x;
	if (x > 9) write(x / 10);
	putchar(x % 10 + '0');
	return;
}

在主函数内直接这么调用:

n = read(), m = read();
write(ans);

总之,有时候还是我们自己写的算法有缺陷,才会导致TLE等问题,这些优化并不是通用的。
所以还是好好学算法吧

fc3e9a1a-a2d5-4608-811b-2d28e70a3cc0

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在C语言中进行矩阵运算的优化有几种方法。首先,可以使用专门的矩阵计算库来提高运算效率。例如,Armadillo是一个C++下的矩阵计算库,它提供了许多矩阵操作函数,支持矩阵逐元素操作、矩阵分块操作以及对整体矩阵的操作等等。它还可以自动检测并使用更快的基本运算实现,如BLAS、OpenBLAS、IntelMKL和AMDACML。此外,ViennaCL是一个并行矩阵计算库,可以在C语言中进行并行矩阵计算,提高运算速度。 另外,还可以使用OpenCV的矩阵计算功能来进行优化。OpenCV提供了类Matlab的矩阵C接口,可以方便地进行计算机视觉和机器学习相关的矩阵操作。它还提供了cv::gpu模块和cv::ocl模块,分别支持CUDA和OpenCL的并行矩阵计算功能,可以进一步提高运算效率。 除了使用专门的矩阵计算库,还可以使用一些优化技术来提高矩阵运算的效率。例如,可以使用多线程或并行计算来加速矩阵运算。还可以使用SIMD指令集来进行向量化计算,提高运算速度。此外,还可以使用矩阵分块技术来减少内存访问次数,提高缓存命中率,从而提高运算效率。 总之,对于C语言中的矩阵运算优化,可以选择使用专门的矩阵计算库,如Armadillo和ViennaCL,也可以使用OpenCV的矩阵计算功能。此外,还可以使用多线程、并行计算、SIMD指令集和矩阵分块等技术来提高运算效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值