最长公共子序列是很基本的算法,只是最近用到了就又拿来学习一下,网上有很多很多的Java版本的,的确写的也很不错,思想都很好,大致上分为三种:
1.基于递归的思想
2.基于动态规划的思想
3.基于HashMap的动态规划
在这里我使用的是python来实现,方法很简单,先看程序:
#!usr/bin/env python
#encoding:utf-8
'''
__Author__:沂水寒城
功能:计算字符串之间的最长公共子序列
'''
def get_lcs(string1, string2):
'''
输入:待比较的两个字符串
输出:降序输出的(子序列长度,子序列)列表
'''
string1_list=list(string1)
string2_list=list(string2)
lcs_list=[]
for i in range(len(string1_list)):
flag=0
lcs=''
for j in range(i,len(string1_list)):
for k in range(flag, len(string2_list)):
if string1_list[j]==string2_list[k]:
lcs+=string1_list[j]
flag=k+1
lcs_list.append((len(lcs), lcs))
print len(lcs_list)
return sorted(lcs_list, reverse=True)
if __name__ == '__main__':
lcs_list=get_lcs("abcdjio7890bhsdjknyewhbnvd", "djio78347bvfdjbnknyew")
print lcs_list
结果如下:
26
[(11, 'io77bbknyew'), (10, 'o77bbknyew'), (9, 'ddjbknyew'), (9, 'ddjbknyew'), (9, '77bbknyew'), (8, 'jjbknyew'), (8, 'ddjknyew'), (8, 'ddjknyew'), (8, 'ddjknyew'), (8, '8bbknyew'), (7, 'jjknyew'), (7, 'bbknyew'), (7, 'bbknyew'), (7, 'bbknyew'), (7, 'bbknyew'), (7, 'bbknyew'), (5, 'nnyew'), (5, 'knyew'), (4, 'bbnn'), (4, 'bbnn'), (3, 'yew'), (2, 'vd'), (2, 'nn'), (2, 'ew'), (2, 'dd'), (1, 'w')]
[Finished in 0.5s]
算法的思想也很简单,这里简单说一下:首先将字符串转换成字符串列表形式,以第一个字符串为基准开始循环遍历比较,设置标志位,目的是为了只比较第二个字符串跟第一个字符串字符相同位置之后的字符串,而不重头开始比较,保证了效率的同时保证了得到的子序列中的元素相对位置与原始字符串中各个元素的相对位置是相同的。