倒排索引查询
总时间限制: 1000ms 内存限制: 131072kB描述
现在已经对一些文档求出了倒排索引,对于一些词得出了这些词在哪些文档中出现。
要求对于倒排索引实现一些简单的查询,即查询某些词同时出现,或者有些词出现有些词不出现的文档有哪些。 输入第一行包含一个数N,1 <= N <= 1000,表示倒排索引表的数目。
接下来N行,每行第一个数c
i,表示这个词出现在了多少个文档中。接下来跟着c
i个数,表示出现在的文档编号,编号不一定有序。1 <= c
i <= 1000,文档编号为32位整数。
接下来一行包含一个数M,1 <= M <= 100,表示查询的数目。
接下来M行每行N个数,每个数表示这个词要不要出现,1表示出现,-1表示不出现,0表示无所谓。数据保证每行至少出现一个1。输出共M行,每行对应一个查询。输出查询到的文档编号,按照编号升序输出。
如果查不到任何文档,输出"NOT FOUND"。样例输入
3
3 1 2 3
1 2
1 3
3
1 1 1
1 -1 0
1 -1 -1 样例输出
NOT FOUND
1 3
1
我的解法:
/*=============================================================================
# FileName: inverted_search.cpp
# Desc:
# Author: zhuting
# Email: cnjs.zhuting@gmail.com
# HomePage: my.oschina.net/locusxt
# Version: 0.0.1
# CreatTime: 2013-12-17 18:38:37
# LastChange: 2013-12-17 18:38:37
# History:
=============================================================================*/
#include
#include
#include
#include
#include
#include
#define maxn 1000005/*文件数目最大为1000005, 编号大小为int范围需要hash一下*/
using namespace std;
typedef map hmap;/*前面是hash后的值*/
map rehmap;/*前面是hash前的值*/
hmap mymap;
bitset mybs[1005];/*每个单词对应出现过的文件*/
int id_sum = 0;/*文件总数*/
bitset bs_tmp;
int main()
{
int n = 0;
int doc_sum = 0, id = 0;
scanf("%d", &n);
for (int i = 0; i < n; ++i)
{
scanf("%d", &doc_sum);
for (int j = 0; j < doc_sum; ++j)
{
scanf("%d", &id);
int tmp = rehmap[id];
if (tmp == 0)/*如果当前还没有加入这个文件*/
{
++id_sum;
mymap[id_sum] = id;
rehmap[id] = id_sum;
tmp = id_sum;
}
mybs[i + 1][tmp] = 1;
}
}
int m = 0;
int state = 0;
scanf("%d", &m);
for (int i = 0; i < m; ++i)
{
bool is_first = 1, is_find = 0;
for (int j = 0; j < n; ++j)
{
scanf("%d", &state);
if (state == 1)/*该单词需要存在*/
{
if (is_first)
{
bs_tmp = mybs[j + 1];
is_first = 0;
}
else bs_tmp &= mybs[j + 1];
}
else if (state == -1)/*该单词不存在*/
{
if (is_first)
{
bs_tmp = ~mybs[j + 1];
is_first = 0;
}
else bs_tmp &= ~mybs[j + 1];
}
}
if (bs_tmp.none())/*不存在符合条件的文件*/
{
printf("NOT FOUND\n");
continue;
}
is_first = 1;
set set_tmp;/*用set对文件编号排序*/
for (int j = 1; j <= id_sum; ++j)
{
if (bs_tmp[j])
set_tmp.insert(mymap[j]);
}
set :: iterator setp = set_tmp.begin();
while (setp != set_tmp.end())
{
if (!is_first)
printf(" ");
is_first = 0;
printf("%d", *setp);
setp++;
}
printf("\n");
}
return 0;
}