单词的划分
Time Limit:1000MS Memory Limit:30000KB
Description
有一个很长的由小写字母组成字符串。为了便于对这个字符串进行分析,需要将它划分成若干个部分,每个部分称为一个单词。
出于减少分析量的目的,我们希望划分出的单词数越少越好。你就是来完成这一划分工作的。
Input
第一行为一整数T,表示有T组测试数据。
每组测试数据第一行为一字符串。(长度小于256)
第二行为一整数N。(1<=N<=100)
以下N行,每行一个单词,每个单词长度小于128。
Output
每组测试数据占一行,这一行只有一个整数,表示字符串可以被划分成的最少的单词数。我们保证单词是可划分的。
Sample Input
1
realityour
5
real
reality
it
your
our
Sample Output
2
这道题是比较基础的动态规划题(DP),DP是一种思想,常用来求解最优化问题,用动态规划求解最优化问题的第一步就是刻画最优解的结构,具体参见《算法导论》,动态规划的核心是状态转移方程,只要能够写出状态转移方程,问题基本就解决了。我们以此题为例,看看怎么得到这个问题的状态转移方程。这道题是求划分的最小数,我们假设f(i)为长度为i的字符串被划分的最少单词数,f(0)=0。那么f(i)=min(f(i),f(i-length(w)+1),其中w代表给定字典里的单词;大家可能不明白f(i-length(w)+1,我给大家解释一下,就以给定的测试用例为例:
字符串S
如图所示,当i=4时,此时字典里有单词real匹配,因为这是字符串S中第一个单词,因此上一个单词实际不存在,指定为f(0).因此f(4)=min(f(4),f(4-匹配的单词长度)+1).当i=6时,又有单词it匹配,因此f(6)=min(f(6),f(6-2)+1)。如图所示:
所谓的状态转移就是从上一个状态转移到当前状态。即字符串realit最小划分数的上一个状态是real的最小划分数+1,看的同学可以好好体会一下。下面把代码贴上:
#include <iostream>
#include <string>
#include <vector>
#include <cstring>
#include <algorithm>
using namespace std;
int com(string s, int pos, string s2)
{
int index = pos-1;
for(int i = s2.length()-1; i >= 0; --i)
{
if(s2[i] != s[index--])
{
return 0;
}
}
return 1;
}
int main()
{
int num;
cin >> num;
int f[300];
while(num--)
{
f[0] = 0;
for(int i = 1; i < 300; ++i)
{
f[i] = 1000000;
}
string s;
cin >> s;
int n;
cin >> n;
vector<string> v;
for(int i = 0; i < n; ++i)
{
string str;
cin >> str;
v.push_back(str);
}
for(int i = 1; i <= (int)s.length(); ++i)
{
for(int j = 0; j <(int)v.size(); ++j)
{
int length = v[j].length();
if(i < length)
{
continue;
}
else if(com(s,i,v[j]))
{
f[i] = min(f[i],f[i-length]+1);
//cout << "f[" << i << "] " << f[i] << endl;
}
}
}
cout << f[s.length()] << endl;
}
return 0;
}