OpenJudge | 倒排索引

Mryan2005

已于 2024-09-11 21:46:04 修改

阅读量245

点赞数 4

分类专栏： # openJudge 文章标签：算法数据结构 c++ 开发语言 OpenJudge

于 2024-09-11 21:44:58 首次发布

本文链接：https://blog.csdn.net/qq_21739599/article/details/142150352

版权

openJudge 专栏收录该内容

69 篇文章 0 订阅

订阅专栏

总时间限制: 1000ms 内存限制: 131072kB

描述

给定一些文档，要求求出某些单词的倒排表。

对于一个单词，它的倒排表的内容为出现这个单词的文档编号。

输入

第一行包含一个数N，1 <= N <= 1000，表示文档数。
接下来N行，每行第一个数ci，表示第i个文档的单词数。接下来跟着ci个用空格隔开的单词，表示第i个文档包含的单词。文档从1开始编号。1 <= ci <= 100。
接下来一行包含一个数M，1 <= M <= 1000，表示查询数。
接下来M行，每行包含一个单词，表示需要输出倒排表的单词。
每个单词全部由小写字母组成，长度不会超过256个字符，大多数不会超过10个字符。

输出

对于每一个进行查询的单词，输出它的倒排表，文档编号按从小到大排序。
如果倒排表为空，输出"NOT FOUND"。

样例输入

3
2 hello world
4 the world is great
2 great news
4
hello
world
great
pku

样例输出

1
1 2
2 3
NOT FOUND

分析

这是检索问题
存进去的是单词，但要找的是单词出现在文件的位置，者可以考虑用map来解决。

Code

暴力解法

#include <bits/stdc++.h>
using namespace std;
struct file {
	int ci;
	char words[100][257];
};
int main() {
	int N, ci, M;
	scanf("%d", &N);
	file *a = (file*)malloc(sizeof(file)*1000);
	for(int i = 0; i < N; ++i) {
		scanf("%d", &ci);
		a[i].ci = ci;
		for(int j = 0; j < ci; ++j) {
			cin >> a[i].words[j];
		}
	}
	scanf("%d", &M);
	for(int i = 0; i < M; ++i) {
		char s[257];
		int res[1000], p = 0;
		scanf("%s", s);
		for(int j = 0; j < N; ++j) {
			for(int k = 0; k < a[j].ci; ++k) {
				if(strcmp(a[j].words[k], s) == 0) {
					res[p++] = j+1;
					break;
				}
			}
		}
		if(p > 0) {
			for(int i = 0; i < p; ++i) {
				printf("%d ", res[i]);
			}
		} else if(p == 0) {
			printf("NOT FOUND");	
		}
		printf("\n");
	}
}

哈希解决法

#include <bits/stdc++.h>
using namespace std;
int main() {
	int N, ci, M;
	string s;
	scanf("%d", &N);
	unordered_map<string, set<int>> mp;
	for(int i = 1; i <= N; ++i) {
		scanf("%d", &ci);
		for(int j = 1; j <= ci; ++j) {
			cin >> s;
			if(mp.find(s) != mp.end()) mp[s].insert(mp[s].end(), i);
			else {
				set<int> a;
				a.insert(i);
				mp.insert(make_pair(s, a));
			}
		}
	}
	scanf("%d", &M);
	for(int i = 1; i <= M; ++i) {
		cin >> s;
		if(mp.find(s) != mp.end()) {
			for(auto i: mp[s]) {
				printf("%d ", i);
			}
		} else {
			printf("NOT FOUND");
		}
		printf("\n");
	}
}