用Java语言实现余弦定理和修正余弦

原创 2018年04月17日 19:49:58

       在NLP自然语言处理中,常常会有推荐相关的算法,这就免不了相关的距离计算公式计算两个向量之间的举例。这里用Java语言实现余弦定理和修正余弦,直接上代码~

【余弦定理】

package com.xzw.cos;

import java.util.Map;
import java.util.Map.Entry;

/**
 * 相似度计算,余弦定理Java实现
 * @author xzw
 *
 */
public class Cos {
	public static double getTwoVectorsSimilar(Map<String, Double> src, Map<String, Double> dest){
		double score = 0;
		if (src.size() == 0 || dest.size() == 0) {
			return 0;
		}
		double v1 = 0, v2 = 0, fenzi = 0, fmOne = 0, fmTwo = 0;
		for (Entry<String, Double> item : src.entrySet()) {
			v1 = item.getValue();
			fmOne += v1 * v1;
			if (dest.containsKey(item.getKey())) {
				v2 = dest.remove(item.getKey());
				fmTwo += v2 * v2;
				fenzi += v1 * v2;
			}
		}
		for (double dv : dest.values()) {
			fmTwo += dv * dv;
		}
		dest.clear();
		dest = null;
		if (fmOne == 0 || fmTwo == 0) {
			return 0;
		}else {
			score = fenzi / Math.sqrt(fmOne * fmTwo);
		}
		return score;
	}

}

【修正余弦】

package com.xzw.cos;

import java.util.Map;
import java.util.Map.Entry;

/**
 * 相似度计算,修正余弦Java实现
 * @author xzw
 *
 */
public class NodCos {
	public static double getSim(Map<String,Double> src,
			Map<String,Double> dest){
		double score = 0;
		double avgs = 0;
		double avgd = 0;
		if(src.size() == 0 || dest.size() == 0){
			return 0;
		}
		for( double v :src.values()){
			avgs += v;
		}
		avgs = avgs / src.size();
		for( double v :dest.values()){
			avgd += v;
		}
		avgd = avgd / dest.size();
		double v1 = 0, v2 = 0, fz = 0, fm1 = 0, fm2 = 0;
		for (Entry<String, Double> items : src.entrySet()) {
			v1 = items.getValue();
			fm1 += (v1 - avgs) * (v1-avgs);
			if(dest.containsKey(items.getKey())){
				v2 = dest.remove(items.getKey());
				fm2 += (v2 - avgd) * (v2 - avgd);
				fz += (v1 - avgs) * (v2 - avgd);
			}
		}
		for(double dv : dest.values()){
			fm2 += (dv - avgd) * (dv - avgd);
		}
		dest.clear();
		dest = null;
		if(fm1 == 0 || fm2 == 0){
			return 0;
		} else{
			score = fz / Math.sqrt((fm1 * fm2));
		}
		return score;
	}

}
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/gdkyxy2013/article/details/79979650

算法-余弦定理与相关性比较

利用余弦定理计算两个向量的相关性(或相似性)
  • pierre_
  • pierre_
  • 2016-12-26 22:26:56
  • 1067

相似度计算公式(皮尔森pearson和余弦)的Java实现

  • 2014年11月20日 19:53
  • 3KB
  • 下载

向量空间模型(VSM)的余弦定理公式(用余弦定理来表示向量之间的相似度)

参考:http://blog.sina.com.cn/s/blog_5caa94a0010122dz.html 在文本挖掘中计算2篇文章相似度常用向量空间模型中的余弦定理公式判断。  ...
  • longyi_java
  • longyi_java
  • 2013-03-01 11:39:22
  • 6923

文本相似度算法(余弦定理)

文本相似度算法(余弦定理) 最近由于工作项目,需要判断两个txt文本是否相似,于是开始在网上找资料研究,因为在程序中会把文本转换成String再做比较,所以最开始找到了这篇关于 距离编辑算法 B...
  • itstt
  • itstt
  • 2013-09-09 20:22:49
  • 12422

DirectX11 兰伯特余弦定理(Lambert)

兰伯特余弦定理(Lambert) 1. 关于光照强烈度的思考 垂直照向平面的线比从侧面照向平面的线更加强烈(见下图)。 假设有一块很小的区域dA。当法线向量n与光照向量L平行时,区域dA受到...
  • sinat_24229853
  • sinat_24229853
  • 2015-10-02 23:03:06
  • 1642

背包问题 3 多重背包 解题报告

Before ACM can do anything, a budget must be prepared and the necessary financial support obtained. ...
  • Stray_Lambs
  • Stray_Lambs
  • 2017-09-01 21:04:15
  • 181

余弦定理判断字符串相似度

最近碰到一个需求需要判断文本串的相似度,借助了余弦定理。此处仅提供代码,具体余弦定理的实现原理我不会。保存一下,以后可以直接用,这个算法不支持英文和数字。比如yy和yy哒进行比较,就会有问题。pack...
  • wengsy_5041
  • wengsy_5041
  • 2017-08-29 23:53:48
  • 208

python scipy使用余弦定理求句子相似度

import jieba import gensim import numpy as np from gensim import corpora from scipy.spatial.distance...
  • u011311291
  • u011311291
  • 2018-01-25 15:08:01
  • 64

Java实现-余弦相似度

Cosine similarity is a measure of similarity between two vectors of an inner product space that meas...
  • qq_14927217
  • qq_14927217
  • 2017-07-14 09:01:01
  • 801

基于物品的协同过滤_修正的余弦相似度

from math import sqrt users3 = {"David": {"Imagine Dragons": 3, "Daft Punk": 5, ...
  • u013058160
  • u013058160
  • 2016-04-17 15:33:21
  • 1121
收藏助手
不良信息举报
您举报文章:用Java语言实现余弦定理和修正余弦
举报原因:
原因补充:

(最多只允许输入30个字)