信息竞赛赛场技巧 · 数据生成与对拍
在赛场上,你是否遇到过下面的情况:
- 写好了一份代码,但不知道是否正确;
- 搞出来了一个“莫名其妙”的贪心,但无法证明正确性;
- 奇奇怪怪的状态转移方程,不知道如何证明。
那么,你来对了!本篇文章将会就赛场上如何生成测试数据和如何对拍的问题进行研究和讨论。话不多说,进入正题:
数据生成
光有代码,没有数据肯定是不行的。数据可以说是一道题中比较重要的部分。仅次于题目描述。只有有了可靠的数据,我们才能够检验我们代码的正确性。在赛场上,由于无法使用诸如 testlib
或者 cyaron
之类的外部工具,但我们却可以借助 Dev C++
中为我们提供的函数进行数据生成(本文作者电脑系统为 Windows 11
,使用的是 Dev C++ 5.11
,编译时会加上 -std=c++14 -O2
,下面的内容以此作为标准,如无特殊情况,不再特殊说明)。
先来介绍两个函数:
-
rand()
:生成一个值在 [ 0 , RAND_MAX ] [0,\text{RAND\_MAX}] [0,RAND_MAX] 范围内的随机整数; -
srand(seed)
:接受unsigned int
类型的参数seed
,以seed
为随机种子。
注意:
RAND_MAX
的取值在不同环境下不同,在 Windows 系统下为 32767 32767 32767,在 Unix 系统下为 2147483647 2147483647 2147483647,特此说明。
通过以上学习,我们不难写出以下代码并运行:
#include<bits/stdc++.h>
int main() {
printf("%d\n", RAND_MAX);
for(int i = 1; i <= 10; i++) {
printf("%d\n", rand());
}
return 0;
}
多运行几次后,可以注意到,不管怎样,程序的输出都是一样的。这是因为它的随机种子是一样的,即使换一台电脑也会是一样的结果。所以,我们要在主函数开头加一行代码 srand((unsigned)time(0));
(或写为 srand((unsigned)time(NULL));
),即可以当前的时间作为随机种子,这样生成的数字将会不同:
#include<bits/stdc++.h>
int main() {
srand((unsigned)time(0));
printf("%d\n", RAND_MAX);
for(int i = 1; i <= 10; i++) {
printf("%d\n", rand());
}
return 0;
}
这样直接生成的数据比较小,所以如果给定一个整数 n n n,要求生成 [ 0 , n − 1 ] [0,n-1] [0,n−1] 内的整数,我们不妨使用如下代码:
int random(int n) {
return (long long)rand() * rand() % n;
}
注意:由于这里有平方运算,所以一定要注意数据类型的选取,防止溢出。
以上就是数据生成器的基本用法,下面一部分将会介绍一些常用的方案:
常见生成器的写法
随机生成整数序列
int n = random(100000) + 1;
int m = 1000000000;
for (int i = 1; i <= n; i++) {
a[i] = random(2 * m + 1) - m;
}
随机生成区间
for (int i = 1; i <= m; i++) {
int l = random(n) + 1;
int r = random(n) + 1;
if (l > r) swap(l, r);
printf("%d %d\n", l, r);
}
随机生成树
for (int i = 2; i <= n; i++) {
int fa = random(i-1) + 1;
int val = random(1000000000) + 1;
printf("%d %d %d\n", fa, i, val);
}
随机生成图
pair<int, int> e[1000005];
map<pair<int, int>, bool> h;
for (int i = 1; i < n; i++) {
int fa = random(i) + 1;
e[i] = make_pair(fa, i + 1);
h[e[i]] = h[make_pair(i + 1, fa)] = 1;
}
for (int i = n; i <= m; i++) {
int x, y;
do {
x = random(n) + 1, y = random(n) + 1;
} while (x == y || h[make_pair(x, y)]);
e[i] = make_pair(x, y);
h[e[i]] = h[make_pair(y, x)] = 1;
}
random_shuffle(e + 1, e + m + 1);
for (int i = 1; i <= m; i++) {
printf("%d %d\n", e[i].first, e[i].second);
}
对拍
在对拍之前,我们要准备好三个程序:
data.cpp
:数据生成器;AC.cpp
:自己准备提交的代码;BL.cpp
:暴力程序。
以 洛谷P1678 为例,现在我已经写好了三个程序:
//准备提交的程序(AC.cpp)
#include<bits/stdc++.h>
using namespace std;
const int large = 100000 + 10;
int m, n, x;
vector<int> sor;
int stu[large];
long long ans;
int main() {
freopen("data.in", "r", stdin);
freopen("data.out", "w", stdout);
ios::sync_with_stdio(false);
cin.tie(0), cout.tie(0);
cin >> m >> n;
sor.push_back(-100000000);
for (int i = 1; i <= m; i++) cin >> x, sor.push_back(x);
sor.push_back(100000000);
for (int i = 1; i <= n; i++) cin >> x, stu[i] = x;
sort(sor.begin(), sor.end());
for (int i = 1; i <= n; i++) {
int pos = upper_bound(sor.begin(), sor.end(), stu[i]) - sor.begin();
ans += min(abs(sor[pos] - stu[i]), abs(sor[pos - 1] - stu[i]));
}
cout << ans;
return 0;
}
//暴力程序(BL.cpp)
#include<bits/stdc++.h>
int a[1010];
int ans;
using namespace std;
int main() {
freopen("data.in", "r", stdin);
freopen("data.ans", "w", stdout);
ios::sync_with_stdio(false);
cin.tie(0), cout.tie(0);
int n,m;
cin >> n >> m;
for (int i = 1; i <= m; i++) cin>>a[i];
for (int i = 1; i <= n; i++) {
int x;
cin >> x;
int minnum = INT_MAX;
for (int j = 1; j <= m; j++) {
if (abs(a[j]-x) <minnum) minnum = abs(a[j]-x);
}
ans += minnum;
}
cout << ans;
return 0;
}
//数据生成器(data.cpp)
#include<bits/stdc++.h>
#define random(a,b) (rand()%(b-a+1)+a)
using namespace std;
int main(){
freopen("data.in", "w", stdout);
srand((unsigned)time(NULL));
int m = random(1,50), n = random(1,50);
cout << m << n;
for (int i = 1; i <= m; i++) cout << random(1,10000) <<' ';
cout << endl;
for (int i = 1; i <= n; i++) cout << random(1,10000) <<' ';
return 0;
}
将这三个 cpp
文件置于同一个文件夹下并全部编译,生成三个 exe
程序,此时,再写一个程序 checker.cpp
,用于比较输出文件是否相同:
#include<bits/stdc++.h>
using namespace std;
int main() {
while(1) {
system("data.exe");
system("BL.exe");
system("AC.exe");
if(system("fc data.out data.ans"))
break;
}
return 0;
}
编译并运行,此时有两种情况:
第一种如上图所示,比较程序一直在运行,表示在目前你所制造的数据中,AC.cpp
和 BL.cpp
所输出的答案是一样的;
如上图,出现这种情况说明暴力代码和将要提交的代码给出的答案不同,说明程序有错误。由于之前我们设定的是一旦发现不同结束运行,这样子的话我们就可以用出现错误的数据去调试我们的代码,不会让这份数据被覆盖掉。
以上就是赛场上进行数据生成和对拍的方法,希望能帮到大家!