关闭

华为机试---计算字符串的距离

标签: java华为
151人阅读 评论(0) 收藏 举报
分类:

题目描述

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。

Ex:

字符串A:abcdefg

字符串B: abcdef

通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

要求:

给定任意两个字符串,写出一个算法计算它们的编辑距离。

 

请实现如下接口

/* 功能:计算两个字符串的距离

 * 输入:字符串A和字符串B

 * 输出:无

 * 返回:如果成功计算出字符串的距离,否则返回-1

 */


输入描述:

输入两个字符串

输出描述:

得到计算结果

输入例子:
abcdefg
abcdef
输出例子:
1
import java.util.Scanner;

public class Main {
	public static void main(String[] args) {
		Scanner scan = new Scanner(System.in);		
		while (scan.hasNext()) {
			String str1 = scan.nextLine();
			String str2 = scan.nextLine();
			int distance = calStringDistance(str1, str2);
			System.out.println(distance);
		}//endwhile		
		scan.close();
	}
	/**
	 * 计算两个字符串的距离
	 * 删除、替换、插入距离都为1
	 * */
	private static int calStringDistance(String str1 , String str2){
		int n = str1.length();
		int m = str2.length();
		//创建二维数组保存编辑距离
		//dp[i][j]代表将str1的前i个字符修改成str2的前j个字符的编辑距离
		int[][] distance = new int[n + 1][m + 1];
		//1、如果str1和str2都为空,编辑距离为0
		distance[0][0] = 0;
		//2、如果str1为空,str2不为空,str1修改成str2的前j个字符的编辑距离就是j;j次插入操作
		for(int j = 1 ; j <= m; ++j){
			distance[0][j] = j;
		}
		//3、如果str2为空,str1不为空,str1的前i个字符修改成str2的编辑距离就是i;i次删除操作
		for(int i = 1 ; i <= n; ++i){
			distance[i][0] = i;
		}
		//4、如果str1和str2都不为空
		for(int i = 1 ; i <=n ; i++){
			for(int j = 1; j <= m ; j++){
				if(str1.charAt(i - 1) == str2.charAt(j - 1)){
					//如果i和j位置的字符相同,编辑距离与 i-1修改成j-1相同
					distance[i][j] = distance[i - 1][j - 1];
				}else{
					//如果i和j位置的字符不相同,编辑距离有三种情况
					/* (1) i-1修改成j的编辑距离+1
					 * (2) i修改成j-1的编辑距离+1
					 * (3) i-1修改成j-1的编辑距离+1
					 * 取三者的最小值,得出前i个字符修改成前j个字符的最少编辑操作
					 * */
					distance[i][j] = 1 + min(distance[i - 1][j] , distance[i][j - 1] , distance[i - 1][j - 1]);
				}
			}	
		}
		return distance[n][m];
	}
	/**
	 * 求三个整数中的最小值
	 * */
	private static int min(int i, int j, int k) {
		int min = i;
		if(min > j ){
			min = j;
		}
		if(min > k){
			min = k;
		}
		return min;		
	}
}


0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:32926次
    • 积分:1130
    • 等级:
    • 排名:千里之外
    • 原创:79篇
    • 转载:0篇
    • 译文:0篇
    • 评论:7条
    文章分类
    文章存档
    最新评论