php-数据分析 余弦相似度实现
<?php
/**
* 数据分析引擎
* 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。
* 求出分析向量与基准向量的余弦值
* @author yu.guo@okhqb.com
*/
/**
* 获得向量的模
* @param unknown_type $array 传入分析数据的基准点的N维向量。|eg:array(1,1,1,1,1);
*/
function getMarkMod($arrParam){
$strModDouble = 0;
foreach($arrParam as $val){
$strModDouble += $val * $val;
}
$strMod = sqrt($strModDouble);
//是否需要保留小数点后几位
return $strMod;
}
/**
* 获取标杆的元素个数
* @param unknown_type $arrParam
* @return number
*/
function getMarkLenth($arrParam){
$intLenth = count($arrParam);
return $intLenth;
}
/**
* 对传入数组进行索引分配,基准点的索引必须为k,求夹角的向量索引必须为 'j'.
* @param unknown_type $arrParam
* @param unknown_type $index
* @ruturn $arrBack
*/
function handIndex($arrParam, $index = 'k'){
foreach($arrParam as $key => $val){
$in = $index.$key;
$arrBack[$in] = $val;
}