1.简介
接着上一篇OpenBlas浮点运算加速:https://blog.csdn.net/haohaohaihuai/article/details/104918288
这次我们探讨下求用OpenBlas来加速计算余弦距离,首先我们来了解下什么是余弦距离。
假如有2个数组:
float A[9] = {1.0, 1.0, 2.0, 1.0, 1.0, 1.0, 0.0, 0.0, 0.0};
float B[9] = {1.0, 1.0, 1.0, 0.0, 1.0, 1.0, 1.0, 1.0, 1.0};
如果要求这个数组的相似度怎么办,这个时候就可以借助余弦相似度来求。我们把这些点想象成空间的点,距离越小,相似度越高。余弦值的范围在[-1,1]之间,值越趋近于1,代表两个向量的方向越接近;越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交。因为cosine 0的值是1,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性" 。
公式如下:
2.测试
余弦相似度公式是理论基础,这里我们不讨论怎么用普通方法计算余弦距离,数据里大的时候又要求速度的时候用普通方法计算,速度就跟不上,这里我们使用OpenBlas来加速计算。不知道OpenBlas是什么的朋友请看上一篇博文,废话不多说,上代码。
int main()
{
float A[9] = {1.0, 1.0, 2.0, 1.0, 1.0, 1.0, 0.0, 0.0, 0.0};
float B[9] = {1.0, 1.0, 1.0, 0.0, 1.0, 1.0, 1.0, 1.0, 1.0};
float resultA_B = cblas_sdot((blasint)9,A, 1, B, 1);
float resultA_A = cblas_sdot((blasint)9,A, 1, A, 1);
float resultB_B = cblas_sdot((blasint)9,B, 1, B, 1);
float m_degree = resultA_B/(sqrt(resultB_B)*sqrt(resultA_A));
printf("feature match degree:%f",m_degree);
return 0;
}
得到计算结果:0.707107,也是相似度70%,相似度比较高。而且耗时只用了11ms,非常之快。
ok,本次测试到此结束,如果有帮到你的话点个赞~
作者:费码程序猿
欢迎技术交流:QQ:255895056
转载请注明出处