最短摘要
Alibaba笔试题:给定一段产品的英文描述,包含M个英文字母,每个英文单词以空格分隔,无其他标点符号;再给定N个英文单词关键字,请说明思路并编程实现方法
String extractSummary(String description,String[] key words)
目标是找出此产品描述中包含N个关键字(每个关键词至少出现一次)的长度最短的子串,作为产品简介输出。(不限编程语言)20分。
尺取法
主要通过滑动窗口的相关知识进行移动。
1.首先定义左右边界,进行寻找
2.先找左边界,找到第一个元素后,左边界停下。
3.寻找右边界,当左右边界的元素包含了key时候,停下,记录此时的长度,之后右边界不动,左边界继续右移
4.直到右边界再次找到一个key中的元素,停下。右边界移动,直到左右边界再次包含了所有元素
5.不断重复上诉操作直到末尾,最后找出最终结果
description=["I", "love", "you", "and", "me", "do", "you", "like" , "me"]
key = ["you", "like", "me"]
def containAll(description,key,begin,end):
for i in range(len(key)):
if key[i] not in description[begin:(end+1)]:
return False
return 1
def extractSummary(description,key):
#key.sort()
begin=-1#begin和end用于在找到更短的包含全部关键字的子数组时更新
end=-1
j=-1#上一次囊括了所有关键字的右边界
minLen=len(description)#最小长度
for i in range(len(description)):
word1=description[i]
if(word1 not in key):
continue
else:
if(j<len(description) and j>=i and containAll(description,key,i,j)):#如果全部找到
if(j-i+1<minLen):
begin,end=i,j
minLen=j-i+1
continue
if(j==-1):
j=i+1
while(j<len(description)):
word2=description[j]
if(word1 not in key):
j+=1
continue
else:
if(containAll(description,key,i,j)):
if(j-i+1<minLen):
begin,end=i,j
minLen=j-i+1
break
else:
j+=1
print(description)
print(description[begin:(end+1)])
print(begin,end)
extractSummary(description,key)
结果:
['I', 'love', 'you', 'and', 'me', 'do', 'you', 'like', 'me']
['you', 'like', 'me']
6 8