自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 搜索相关度算法 TF-IDF与BM25

TF-IDF VS BM25 在ES5.0版本之前,ES一直用的是TF-IDF来进行相关度算分;在5.0后的版本,ES换成了BM25版本。本文将从算法设计的角度,先介绍两个算法,再结合ES来尝试分析一下各自的优缺点。 算法介绍 TF-IDF和BM25都是用作ES中排序依据的核心部分,它们是组成Lucene中“field weight”的部分,“field weight”用来评测的是search t...

2019-12-22 20:38:25 721 1

原创 多种python方法实现矩阵运算

python在做数据处理方面有很大的优势,但是python的运行速度也一直是为诟病的。近期在工作中就遇到了大维度的矩阵乘法的运算,在作为服务时,响应时间略高,工程上需要在不部署其他分布式的前提下,优化运算速度。 接下来用不同的方式计算一个 100002400维 和 240010000维的矩阵并分别输出计算花费的时间。 numpy 方式 import numpy aa = np.random...

2019-05-21 15:28:35 776

转载 如何用服务等级协议SLA来评估系统

目录如何用服务等级协议SLA来评估系统什么是SLA服务协议SLA服务协议的指标可用性(Availiablity)准确性(Accuracy)系统容量(Capacity)延迟(Latency)参考文献 如何用服务等级协议SLA来评估系统 本文是笔者订阅学习了极客时间蔡元楠老师的专栏《大规模数据处理实战》,总结添加一些自己的学习心得后整理而成。 什么是SLA服务协议 SLA(Service-Level ...

2019-05-12 17:17:25 1902

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除