P1540 机器翻译
题目背景
小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。
题目描述
这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译。
假设内存中有MM个单元,每单元能存放一个单词和译义。每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过M-1,软件会将新单词存入一个未使用的内存单元;若内存中已存入M个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。
假设一篇英语文章的长度为N个单词。给定这篇待译文章,翻译软件需要去外存查找多少次词典?假设在翻译开始前,内存中没有任何单词。
输入输出格式
输入格式:
共2行。每行中两个数之间用一个空格隔开。
第一行为两个正整数M,N代表内存容量和文章的长度。
第二行为N个非负整数,按照文章的顺序,每个数(大小不超过10001000)代表一个英文单词。文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。
输出格式:
一个整数,为软件需要查词典的次数。
输入输出样例
3 7
1 2 1 5 4 4 1
输出样例#1:
5
说明
整个查字典过程如下:每行表示一个单词的翻译,冒号前为本次翻译后的内存状况:
空:内存初始状态为空。
1. 1:查找单词1 并调入内存。
2. 1 2:查找单词2 并调入内存。
3. 1 2:在内存中找到单词1。
4. 1 2 5:查找单词5 并调入内存。
5. 2 5 4:查找单词4 并调入内存替代单词1。
6. 2 5 4:在内存中找到单词4。
7. 5 4 1:查找单词1 并调入内存替代单词2。
共计查了5次词典。
方法一(自己写的):
#include <iostream>
using namespace std;
int main()
{
int M,N,b[1005];//M个单元,N个单词 ,b数组用来存放内存中的单词
int a[1005]={0};//用于标记该单词是否在内存中,1表示在内存中,0表示不在内存中
//最开始内存中没有单词,所以将b数组复制为0
//注意:如果当前读入的单词已经在内存中,就不用存入数组b
int x,L=0,R=0;///x代表当前读入的单词,L指向当前内存中最先存入的,R用于指向当前内存中最后一个存入的
long long count=0;//用于计算一共查了多少次词典
cin>>M>>N;
for(int i=0;i<N;i++)
{
cin>>x;
if(a[x]==0){
count++;
b[R++]=x;
a[x]=1;
if(R>M) //说明 需要清空最早存入内存的那个单词
{
a[b[L]]=0;
L++;
}
}
}
cout<<count;
return 0;
}
方法二:
解题思路:
这道题是让我们实现一个先进先出的缓存机制。
数据的存储:
由于是先进先出,所以我们可以用循环队列来维护缓存中的所有单词,这里可以用C++STL中的queue。
用bool数组存储每个单词是否已经在队列中,这样就可以用 O(1) 的时间判断每个单词是否已在缓存中了。
从前往后依次处理文章中的每个单词,然后分情况处理:
如果 x 已在缓存中,不需要做其他处理;
如果 x 不在缓存中:
如果队列不满,将 x 插入队尾;
如果队列已满,将队头弹出,然后将 x 插入队尾;
时间复杂度分析:
依次对每个单词处理一遍,每次处理时只有常数次操作,所以总时间复杂度是 O(N),其中 N 是单词个数。
#include <iostream>
#include <algorithm>
#include <queue>
using namespace std; const int N = 1010;
int n, m;
bool st[N];
int main()
{
cin >> m >> n;
int res = 0;
queue<int> q;
for (int i = 0; i < n; i++)
{
int x;
cin >> x;
if (!st[x])
{
res++;
if (q.size() == m)
{
st[q.front()] = false;
q.pop();
}
q.push(x);
st[x] = true;
}
}
cout << res << endl;
return 0;
}