解答“倒排索引查询”题目(见后)时,我疏忽把题目中的“1<=N<=1000”看成“1<=N<=100”了[1],提交答案报告时遇到“RuntimeErrror”。
一开始不知道上述疏忽。于是我怀疑自己写的集合求交集、并集和差集的代码出问题。依稀记起STL中有求交集、求并集和求差集的代码。于是赶紧学习去。嗯,容易学。用以下代码就可以:
set_intersection(exist_set.begin(),exist_set.end(),
wordInDocs[j].begin(),wordInDocs[j].end(),
exist_set.begin());
//exist_set, wordInDocs[j]都是set<int>实例
遇到编译报错,原因是exist_set.begin()返回的迭代器是const_iterator类型的,无法完成插入操作。此外查MSDN说明讲到接收结果的区间不能与两个源数据区间重叠。知道了,改成下列用法:
set<int>tmp_exist_set;
set<int>::iterator tmp_itr =tmp_exist_set.begin();
set_intersection(exist_set.begin(),exist_set.end(),
wordInDocs[j].begin(),wordInDocs[j].end(),
tmp_itr);
exist_set= tmp_exist_set;
遇到编译报错,原因还是exist_set.begin()返回的迭代器是const_iterator类型的,无法完成插入操作。嗷嗷,怎么回事?tmp_itr不是const_iterator类型的呀?从csdn网站的论坛中发现解答线索。下为正确答案。
set<int>tmp_exist_set;
set<int>::iterator tmp_itr =tmp_exist_set.begin();
set_intersection(exist_set.begin(),exist_set.end(),
wordInDocs[j].begin(),wordInDocs[j].end(),
inserter(tmp_exist_set,tmp_itr));
exist_set= tmp_exist_set;
inserter(tmp_exist_set,tmp_itr)是生成一个插入器。好的,有空学学插入器。关于STL,我还有很多值得学习的。
倒排索引查询
总时间限制: 1000ms 内存限制: 131072kB
描述
现在已经对一些文档求出了倒排索引,对于一些词得出了这些词在哪些文档中出现。
要求对于倒排索引实现一些简单的查询,即查询某些词同时出现,或者有些词出现有些词不出现的文档有哪些。
输入
第一行包含一个数N,1 <= N <= 1000,表示倒排索引表的数目。
接下来N行,每行第一个数ci,表示这个词出现在了多少个文档中。接下来跟着ci个数,表示出现在的文档编号,编号不一定有序。1 <= ci <= 1000,文档编号为32位整数。
接下来一行包含一个数M,1 <= M <= 100,表示查询的数目。
接下来M行每行N个数,每个数表示这个词要不要出现,1表示出现,-1表示不出现,0表示无所谓。数据保证每行至少出现一个1。
输出
共M行,每行对应一个查询。输出查询到的文档编号,按照编号升序输出。
如果查不到任何文档,输出"NOT FOUND"。
样例输入
3
3 1 2 3
1 2
1 3
3
1 1 1
1 -1 0
1 -1 -1
样例输出
NOT FOUND
1 3
1
[1] 其实呢,造成疏漏是有客观原因的。题目来自OpenJudge,哪知在它的题库里有两道“描述看起来一样”的题目,全局题号分别是6634和7064。实际上,两题有细微差别,前者使用“1<=N<=1000”,而后者使用“1<=N<=100”。我先前提交答案通过了7064 题,拿同样代码交到6634,报告“Runtime Error”。