String Distance compare (最佳字符串匹配算法(Damerau-Levenshtein距离算法))

Damerau–Levenshtein distance  WIKI

http://en.wikipedia.org/wiki/Damerau%E2%80%93Levenshtein_distance

public static partial class StringDistance

        {
            public static int GetDamerauLevenshteinDistance(string source, string target)
            {
                var bounds = new { Height = source.Length + 1, Width = target.Length + 1 };


                int[,] matrix = new int[bounds.Height, bounds.Width];


                for (int height = 0; height < bounds.Height; height++) { matrix[height, 0] = height; };
                for (int width = 0; width < bounds.Width; width++) { matrix[0, width] = width; };


                for (int height = 1; height < bounds.Height; height++)
                {
                    for (int width = 1; width < bounds.Width; width++)
                    {
                        int cost = (source[height - 1] == target[width - 1]) ? 0 : 1;
                        int insertion = matrix[height, width - 1] + 1;
                        int deletion = matrix[height - 1, width] + 1;
                        int substitution = matrix[height - 1, width - 1] + cost;


                        int distance = Math.Min(insertion, Math.Min(deletion, substitution));


                        if (height > 1 && width > 1 && source[height - 1] == target[width - 2] && source[height - 2] == target[width - 1])
                        {
                            distance = Math.Min(distance, matrix[height - 2, width - 2] + cost);
                        }


                        matrix[height, width] = distance;
                    }
                }


                return matrix[bounds.Height - 1, bounds.Width - 1];
            }


        }



http://alias-i.com/lingpipe/demos/tutorial/stringCompare/read-me.html

http://www.joyofdata.de/blog/comparison-of-string-distance-algorithms/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值