- 博客(3)
- 收藏
- 关注
原创 搜索相关度算法 TF-IDF与BM25
TF-IDF VS BM25在ES5.0版本之前,ES一直用的是TF-IDF来进行相关度算分;在5.0后的版本,ES换成了BM25版本。本文将从算法设计的角度,先介绍两个算法,再结合ES来尝试分析一下各自的优缺点。算法介绍TF-IDF和BM25都是用作ES中排序依据的核心部分,它们是组成Lucene中“field weight”的部分,“field weight”用来评测的是search t...
2019-12-22 20:38:25 750 1
原创 多种python方法实现矩阵运算
python在做数据处理方面有很大的优势,但是python的运行速度也一直是为诟病的。近期在工作中就遇到了大维度的矩阵乘法的运算,在作为服务时,响应时间略高,工程上需要在不部署其他分布式的前提下,优化运算速度。接下来用不同的方式计算一个 100002400维 和 240010000维的矩阵并分别输出计算花费的时间。numpy 方式 import numpy aa = np.random...
2019-05-21 15:28:35 796
转载 如何用服务等级协议SLA来评估系统
目录如何用服务等级协议SLA来评估系统什么是SLA服务协议SLA服务协议的指标可用性(Availiablity)准确性(Accuracy)系统容量(Capacity)延迟(Latency)参考文献如何用服务等级协议SLA来评估系统本文是笔者订阅学习了极客时间蔡元楠老师的专栏《大规模数据处理实战》,总结添加一些自己的学习心得后整理而成。什么是SLA服务协议SLA(Service-Level ...
2019-05-12 17:17:25 1955
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人