倒排索引c语言,poj 倒排索引查询 - locusxt's blog - OSCHINA - 中文开源技术交流社区...

倒排索引查询

总时间限制: 1000ms 内存限制: 131072kB描述

现在已经对一些文档求出了倒排索引,对于一些词得出了这些词在哪些文档中出现。

要求对于倒排索引实现一些简单的查询,即查询某些词同时出现,或者有些词出现有些词不出现的文档有哪些。 输入第一行包含一个数N,1 <= N <= 1000,表示倒排索引表的数目。

接下来N行,每行第一个数c

i,表示这个词出现在了多少个文档中。接下来跟着c

i个数,表示出现在的文档编号,编号不一定有序。1 <= c

i <= 1000,文档编号为32位整数。

接下来一行包含一个数M,1 <= M <= 100,表示查询的数目。

接下来M行每行N个数,每个数表示这个词要不要出现,1表示出现,-1表示不出现,0表示无所谓。数据保证每行至少出现一个1。输出共M行,每行对应一个查询。输出查询到的文档编号,按照编号升序输出。

如果查不到任何文档,输出"NOT FOUND"。样例输入

3

3 1 2 3

1 2

1 3

3

1 1 1

1 -1 0

1 -1 -1 样例输出

NOT FOUND

1 3

1

我的解法:

/*=============================================================================

# FileName: inverted_search.cpp

# Desc:

# Author: zhuting

# Email: cnjs.zhuting@gmail.com

# HomePage: my.oschina.net/locusxt

# Version: 0.0.1

# CreatTime: 2013-12-17 18:38:37

# LastChange: 2013-12-17 18:38:37

# History:

=============================================================================*/

#include

#include

#include

#include

#include

#include

#define maxn 1000005/*文件数目最大为1000005, 编号大小为int范围需要hash一下*/

using namespace std;

typedef map hmap;/*前面是hash后的值*/

map rehmap;/*前面是hash前的值*/

hmap mymap;

bitset mybs[1005];/*每个单词对应出现过的文件*/

int id_sum = 0;/*文件总数*/

bitset bs_tmp;

int main()

{

int n = 0;

int doc_sum = 0, id = 0;

scanf("%d", &n);

for (int i = 0; i < n; ++i)

{

scanf("%d", &doc_sum);

for (int j = 0; j < doc_sum; ++j)

{

scanf("%d", &id);

int tmp = rehmap[id];

if (tmp == 0)/*如果当前还没有加入这个文件*/

{

++id_sum;

mymap[id_sum] = id;

rehmap[id] = id_sum;

tmp = id_sum;

}

mybs[i + 1][tmp] = 1;

}

}

int m = 0;

int state = 0;

scanf("%d", &m);

for (int i = 0; i < m; ++i)

{

bool is_first = 1, is_find = 0;

for (int j = 0; j < n; ++j)

{

scanf("%d", &state);

if (state == 1)/*该单词需要存在*/

{

if (is_first)

{

bs_tmp = mybs[j + 1];

is_first = 0;

}

else bs_tmp &= mybs[j + 1];

}

else if (state == -1)/*该单词不存在*/

{

if (is_first)

{

bs_tmp = ~mybs[j + 1];

is_first = 0;

}

else bs_tmp &= ~mybs[j + 1];

}

}

if (bs_tmp.none())/*不存在符合条件的文件*/

{

printf("NOT FOUND\n");

continue;

}

is_first = 1;

set set_tmp;/*用set对文件编号排序*/

for (int j = 1; j <= id_sum; ++j)

{

if (bs_tmp[j])

set_tmp.insert(mymap[j]);

}

set :: iterator setp = set_tmp.begin();

while (setp != set_tmp.end())

{

if (!is_first)

printf(" ");

is_first = 0;

printf("%d", *setp);

setp++;

}

printf("\n");

}

return 0;

}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值