LCS是Longest Common Subsequence的缩写,即最长公共子序列。一个序列,如果是两个或多个已知序列的子序列,且是所有子序列中最长的,则为最长公共子序列。
两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列:
– 字符串12455与245576的最长公共子序列为2455
– 字符串acdfg与adfc的最长公共子序列为adf
run.sh
HADOOP_INPUT="/test/work02/lcs_input.data"
HADOOP_OUTPUT="/test/work02/lcs_output"
hafoop fs -rmr $HADOOP_OUTPUT
hadoop jar /usr/local/src/hadoop-2.6.0/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar \
-input $HADOOP_INPUT \
-output $HADOOP_OUTPUT \
-mapper "python map.py" \
-jobconf "mapred.reduce.tasks=0" \
-jobconf "mapred.job.name=mr_lcs" \
-file ./map.py
map.py