第八届蓝桥杯第六题–最大公共子串(C语言)(填空题)
一.比赛题目
1.题目要求
最大公共子串长度问题就是:求两个串的所有子串中能够匹配上的最大长度是多少。
比如:“abcdkkk” 和 “baabcdadabc”,可以找到的最长的公共子串是"abcd",所以最大公共子串长度为4。下面的程序是采用矩阵法进行求解的,这对串的规模不大的情况还是比较有效的解法。请分析该解法的思路,并补全划线部分缺失的代码。
#include <stdio.h>
#include <string.h>
#define N 256
int f(const char* s1, const char* s2)
{
int a[N][N];
int len1 = strlen(s1);
int len2 = strlen(s2);
int i,j;
memset(a,0,sizeof(int)*N*N);
int max = 0;
for(i=1; i<=len1; i++){
for(j=1; j<=len2; j++){
if(s1[i-1]==s2[j-1]) {
a[i][j] =_____________; //填空
if(a[i][j] > max) max = a[i][j];
}
}
}
return max;
}
int main()
{
printf("%d\n", f("abcdkkk", "baabcdadabc"));
return 0;
}
2.输入与输出
输入:
无
输出:
4
二.分析过程
填空答案为:a[i-1][j-1]+1
1.main函数分析
int main()
{
printf("%d\n", f("abcdkkk", "baabcdadabc"));
return 0;
}
同样的输出,调用函数,传参;
2.f函数分析
int f(const char* s1, const char* s2)
{
int a[N][N];
int len1 = strlen(s1);
int len2 = strlen(s2);
int i,j;
memset(a,0,sizeof(int)*N*N);
int max = 0;
for(i=1; i<=len1; i++){
for(j=1; j<=len2; j++){
if(s1[i-1]==s2[j-1]) {
a[i][j] =_____________; //填空
if(a[i][j] > max) max = a[i][j];
}
}
}
return max;
}
(1)由main函数我们得知s1=abcdkkk;s2=baabcdadabc;
因为调用了库函数#include<string.h>
所以使用了strlen函数1来返回s1和s2的长度(即len1=s1的长度‘7’,len2=s2的长度‘11’);
memset(a,0,sizeof(int)*N*N);
2的意思是将二维数组a[n][n]全部赋值为‘0’;
后面一个双重for循环是用s1数组里面的字符依次去和s2数组里面的字符作判断;如果相等的情况下:a[i][j]=___?___,且如果a[i][j]>max,max=a[i][j];
因为后面返回的是max;所以max就是我们要找的最大公共子串的长度且为一个值,所以a[i][j]也会是赋值一个值;
(2)我们将s1[i-1]和s2[j-1]相等的情况下稍微记录一下,就会得到:
a[1][2]=? |
---|
a[1][3]=? |
a[1][7]=? |
a[1][8]=? |
a[2][1]=? |
a[2][4]=? |
a[2][10]=? |
a[3][5]=? |
a[3][11]=? |
a[4][6]=? |
a[4][8]=? |
这个时候就想到了假如相等就需要把他们特殊化(即第i位的s1数组和第j位的s2数组字符相同);
因为是最大的公共子串,也就是求连续最长的,我们上面把特殊的区别开,如果连续就相加,然后赋值给max;
(3)经过上面的分析,我们得到if(a[i][j] > max) max = a[i][j];
就可以说是进行的判断连续的最大值;所以我们得到a[i][j]是在求连续的最大值,而又要特殊化又要求最大值,就把特殊的赋值为1,且与前一位进行比较,注意因为是求两个串的公共子串,而i代表s1的位数,j代表s2的位数,所以前一位时j-1,i也应该-1;
所以应该填入:
a[i][j] =a[i-1][j-1]+1; //填空
三.整体代码
#include <stdio.h>
#include <string.h>
#define N 256
int f(const char* s1, const char* s2)
{
int a[N][N];
int len1 = strlen(s1);
int len2 = strlen(s2);
int i,j;
memset(a,0,sizeof(int)*N*N);
int max = 0;
for(i=1; i<=len1; i++){
for(j=1; j<=len2; j++){
if(s1[i-1]==s2[j-1]) {
a[i][j] =a[i-1][j-1]+1; //填空
if(a[i][j] > max) max = a[i][j];
}
}
}
return max;
}
int main()
{
printf("%d\n", f("abcdkkk", "baabcdadabc"));
return 0;
}
四.总结
数据小的情况下可以稍微写一写,列举一下,写出来一眼看到a[i][j]是哪几种情况,一下子就看明白了;而且其实就算不懂那两个函数是什么意思,有时候猜到了,不过还是要见多识广啊!小杨因为最开始也不懂memset是什么意思,不过当时猜到了,所以事后百度验证了,也给大家放到了下面的注释里面。