计算两个字符串相似度算法,返回百分号字符串

/**
     * 根据传入的两个字符串判断相似度并转换格式返回带百分号的字符串
     *
     * @param str
     * @param target
     */
    public static String getSimilarityRatioString(String str, String target) {

        // 获取相似度
        float a = getSimilarityRatio(str, target);

        // 转换为字符串
        String result = String.valueOf(a);

        // 截取整数部分
        result = result.substring(0, result.lastIndexOf("."));

        // 转换为数字
        int num = Integer.valueOf(result);

        return num + "%";
    }

    /**
     * 计算两个字符串的相似度,返回小数
     *
     * @param str
     * @param target
     * @return
     */
    public static float getSimilarityRatio(String str, String target) {

        // 矩阵
        int[][] d;
        int n = str.length();
        int m = target.length();
        // 遍历str的
        int i;
        // 遍历target的
        int j;
        // str的
        char ch1;
        // target的
        char ch2;
        // 记录相同字符,在某个矩阵位置值的增量,不是0就是1
        int temp;
        if (n == 0 || m == 0) {
            return 0;
        }
        d = new int[n + 1][m + 1];
        // 初始化第一列
        for (i = 0; i <= n; i++) {
            d[i][0] = i;
        }
        // 初始化第一行
        for (j = 0; j <= m; j++) {
            d[0][j] = j;
        }
        // 遍历str
        for (i = 1; i <= n; i++) {
            ch1 = str.charAt(i - 1);
            // 去匹配target
            for (j = 1; j <= m; j++) {
                ch2 = target.charAt(j - 1);
                if (ch1 == ch2 || ch1 == ch2 + 32 || ch1 + 32 == ch2) {
                    temp = 0;
                } else {
                    temp = 1;
                }
                // 左边+1,上边+1, 左上角+temp取最小
                d[i][j] = Math.min(Math.min(d[i - 1][j] + 1, d[i][j - 1] + 1), d[i - 1][j - 1] + temp);
            }
        }

        return (1 - (float) d[n][m] / Math.max(str.length(), target.length())) * 100F;
    }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java中,可以使用余弦相似度算法计算两个字符串相似度。下面是一个简单的示例: ```java public class CosineSimilarity { public static void main(String[] args) { String s1 = "Hello world"; String s2 = "Hello Java"; double similarity = cosineSimilarity(s1, s2); System.out.println("Similarity between '" + s1 + "' and '" + s2 + "' is: " + similarity); } public static double cosineSimilarity(String s1, String s2) { // 将字符串转换为向量 double[] v1 = toVector(s1); double[] v2 = toVector(s2); // 计算余弦相似度 return cosineSimilarity(v1, v2); } private static double[] toVector(String s) { // 将字符串转换为小写,并去除标点符号 s = s.toLowerCase().replaceAll("\\pP", ""); // 将字符串分割为单词 String[] words = s.split(" "); // 统计每个单词出现的次数 Map<String, Integer> counts = new HashMap<>(); for (String word : words) { counts.put(word, counts.getOrDefault(word, 0) + 1); } // 将每个单词的出现次数作为向量的一个分量 double[] vector = new double[counts.size()]; int i = 0; for (int count : counts.values()) { vector[i++] = count; } return vector; } private static double cosineSimilarity(double[] vectorA, double[] vectorB) { double dotProduct = 0.0; double normA = 0.0; double normB = 0.0; for (int i = 0; i < vectorA.length; i++) { dotProduct += vectorA[i] * vectorB[i]; normA += Math.pow(vectorA[i], 2); normB += Math.pow(vectorB[i], 2); } return dotProduct / (Math.sqrt(normA) * Math.sqrt(normB)); } } ``` 在上面的示例中,首先将两个字符串转换为向量,然后计算它们的余弦相似度。在toVector方法中,将字符串转换为小写并去除标点符号,然后将每个单词出现的次数作为向量的一个分量。在cosineSimilarity方法中,首先计算向量的内积,然后计算向量的模长,并最终计算余弦相似度。最后,在main方法中,使用示例字符串测试余弦相似度算法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值