自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 记一次空格导致的分词故障

搜索效果很大程度上依赖于分词器的性能,而开源分词器普遍在电商场景上优化不足,即使是业界先进的中文分词器,例如百度的LAC,Hanlp,在默认词库下,都无法正确分词iphone14promax。因此使用开源分词器,人工对分词结果的干预能力就非常重要了,而经过这次的故障,显然IK在这方面的不足非常明显。

2022-09-22 15:28:58 407 1

原创 Elasticsearch分词调试常用工具

记录一下Elasticsearch分词调试中常用到的API和索引设置

2022-09-13 18:18:34 702

原创 微信支付流程解析

微信支付流程解析微信支付流程支付流程分析微信支付流程微信支付业务流程时序图详见官方文档。商户调用统一下单接口,生成预支付交易单,微信支付侧返回prepay_id。商户通过各类方式(js、native、小程序等)调起微信支付,发起支付请求,请求中需带有上步中的prepay_id,微信支付返回的结果包括成功、失败和取消。微信支付回调商户的支付结果通知接口,告知支付结果和transaction_id,商户侧需存储transaction_id,以供查询订单状态商户侧可以通过订单查询接口,以订单号或tr

2021-08-11 16:43:23 1362

原创 Elasticsearch搜索(查询)性能优化

搜索(查询)性能优化为文件系统缓存提供更多内存使用更快的硬件数据预热冷热分离分页查询性能优化文档建模搜索尽可能少的字段预索引数据考虑将标识映射为keyword避免使用脚本搜索四舍五入的日期强制merger只读索引预加载全局序数预加载文件系统缓存使用索引排序来加速关联查询使用preference来优化缓存利用率副本可能有助于提高吞吐量,但并非总是如此为文件系统缓存提供更多内存Elasticsearch 严重依赖文件系统缓存来加快搜索速度。通常,您应该确保至少有一半的可用内存进入文件系统缓存,以便 Elas

2021-08-10 21:26:25 1317

原创 Elasticsearch索引(写入)性能优化

索引(写入)性能优化使用bulk请求使用多线程发送数据到Elasticsearch增加刷新(refresh)间隔在初始加载时禁用刷新和副本禁用内存交换(swap)为文件系统缓存提供内存使用自动生成ID使用更快的硬件索引缓冲区的大小禁用_field_names强制合并(merge)Translog设置使用bulk请求批量请求将比单文档索引请求产生更好的性能。为了知道批量请求的最佳大小,您应该在具有单个分片的单个节点上运行基准测试。首先尝试一次索引 100 个文档,然后是 200,然后是 400,等等。在每

2021-08-09 20:33:52 1152

原创 IK分词器实战

ES中分词器Analyzer的组成分词器是专门处理分词的组件,由三部分组成。Character filter:针对原始文本处理,例如去除htmlTokenizer:按照规则切分为单词Token Filter:将切分的单词进行加工,小写,删除stopwords,增加同义词以上三部分是串行处理的关系,除Tokenizer只能一个外,其他两个都可以多个。IK分词器仅实现了TokenizerIK分词器原理IK分词器在是一款基于词典和规则的中文分词器。具有以下特性:采用了特有的“正向迭代最细粒度

2021-02-20 18:07:01 535

原创 信息检索中的基本概念

Percision(查准率)- 尽可能返回较少的无关文档Recall(查全率)- 尽可能返回较多的相关文档Ranking - 是否能够按照相关度进行排序

2020-12-21 21:08:20 308

原创 Elasticsearch中使用IK中文分词

目录前言安装IK Analysis功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入前言Elasticsearch默认不支持中文分词,会把输入的中文按照一个个字符来看待,这种情况下的检索结果,往往都不能满足常规的业务需求。Elas

2020-11-04 21:02:02 616

原创 Elastic Cloud Kubernetes(ECK)安装Elasticsearch、Kibana实战教程

目录Elastic Cloud Kubernetes支持的版本在Kubernetes集群中部署ECK部署ELasticsearch集群创建PV部署ES集群监控集群的健康状态和创建过程访问ES集群JVM堆设置Node配置卷声明模板虚拟内存如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导

2020-09-27 20:21:24 3876 6

原创 在mysql中设置craet_time和update_time默认值并实时更新

在mysql的表结构设计中,我们通常会加入如下两个字段create_timeupdate_time其中,create_time用来表示,本条记录创建的时间,update_time用来表示本条记录中任意字段更新的时间。这两个字段可以设置为datetime类型,那么如何为datetime类型设置默认值并根据当前时间来更新呢?如何做到通过Mysql数据库的设置来实现上述字段的自动化填充呢,而不用在sql语句中手动 来填充呢。方式有二。方式一:通过建表语句来指定。CREATE TA.

2020-07-14 21:52:17 6147

原创 Ubuntu14.04下Opencv2.4.9的安装及配置使用

安装 安装cmake及一些依赖库 sudo apt-get install cmake sudo apt-get install build-essential libgtk2.0-dev libavcodec-dev libavformat-dev libjpeg.dev libtiff4.dev libswscale-dev libjasper-dev安装opencv 从官网下载o

2015-05-22 11:23:59 753

原创 Matlab 2014a Linux下安装破解详细流程

最近由于科研的需要,导师让在linux下使用matlab。本人使用Ubuntu 14.04,Matlab2014a。安装步骤如下:从网盘下载Matlab 网站:http://pan.baidu.com/s/1o6qKdxo#path=%252Fmatlab解压文件 下载完成后,里边有两个压缩文件,分别为part1和part2,用相关软件解压。可在软件中心输入rar搜索并安装。解压完成后

2015-05-22 10:05:43 5525

智能小车黑白线识别寻光寻迹电机驱动原理分析3路寻迹算法分析含原理图和程序

智能小车黑白线识别寻光寻迹电机驱动原理分析3路寻迹算法分析含原理图和程序

2012-07-15

周立功电脑鼠专用手册

周立功电脑鼠专用手册,内含详细介绍,是电脑鼠入门的好资料

2012-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除