余弦相似性 java_Java - 余弦相似性获取文章相似度的java实现 - 圈子 - SegmentFault 思否...

最新推荐文章于 2023-05-18 13:44:13 发布

美国留学中心菌

最新推荐文章于 2023-05-18 13:44:13 发布

阅读量138

点赞数

文章标签：余弦相似性 java

本文链接：https://blog.csdn.net/weixin_35145307/article/details/114224137

版权

该博客介绍了如何使用Java计算文章的余弦相似度，通过ES-IK进行分词，得到词频向量，然后计算两个向量的余弦值，以确定文章的相似性。

摘要由CSDN通过智能技术生成

1.先用es-ik进行文章分词。

2.得到两篇文章的词频向量

3.计算两个向量的余弦相似度，值越大就表示越相似。

package com.xq.algorithm;

import java.util.ArrayList;

import java.util.LinkedHashMap;

import java.util.List;

import java.util.Map;

/**

Title:

Description: 余弦获取文章相似性

@createDate：2013-8-26

@author xq

@version 1.0

public class CosineSimilarAlgorithm {

/**

* @Title: cosSimilarityByFile

* @Description: 获取两个文件相似性

* @param @param firstFile

* @param @param secondFile

* @param @return

* @return Double

* @throws

public static Double cosSimilarityByFile(String firstFile,String secondFile){

try{

Map> firstTfMap=TfIdfAlgorithm.wordSegCount(firstFile);

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注