自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (21)
  • 问答 (1)
  • 收藏
  • 关注

原创 es用户认证与鉴权入门配置

https://www.jianshu.com/p/d021661c9b6ahttps://blog.csdn.net/fxtxz2/article/details/105707317/https://www.mcabana.com/archives/2107.htmlxpack.security.enabled: true一,在elasticsearch.yml文件中配置xpack.security.enabled: truexpack.security.transport.ssl.enabl

2020-05-29 08:33:43 6707 1

原创 es之ingest、pipeline、painless

一,injest pipeline// 测试POST _ingest/pipeline/_simulate{ "pipeline":{ "description":"split tags", "processors": [ { "split":{ "field":"tags", "separator":"," } } ] },

2020-05-28 12:35:37 699

原创 es之关联查询

es并不擅长关联查询,其提供的解决方案有三种:对象,嵌套对象,父子文档一,对象POST moive/_doc/1{ "movie":"first blog", "actors":[{ "firstName":"lu", "lastName":"yong" },{ "firstName":"liu", "lastName":"yo3ng" } ]}GET moive/_search{ "query": { "bool": {

2020-05-27 23:24:15 9379

原创 elasticsearch missing authentication credentials for REST request [/_cluster/state?pretty]

因为有xpack认证,所以需要带认证信息,注意ip前加上用户名和密码,用@隔开。http://elastic:VEiYbtAop4Exe8rR7C@1.6.26.136:9200/wh_sku/_bulk

2020-05-27 10:27:00 2306 3

原创 es聚合分析的原理及精准度问题

2020-05-27 08:16:37 993

原创 es之聚合作用范围与排序

聚合的作用范围有4种:默认对查询结果进行聚合,filter,post_filter,global一,默认对查询结果进行聚合GET kibana_sample_data_ecommerce/_search{ "query": { "match_all": {} }, "aggs": { "day_bucket": { "terms": { "field":"order_date", // 排序 "order":[

2020-05-27 08:06:28 570

原创 es之pipeline用法

GET kibana_sample_data_ecommerce/_search{ "size": 1, "aggs": { "count_of_day": { "terms": { "field":"day_of_week_i" }, "aggs": { "avg_day_count": { "avg": { "field":"taxful_total_price"

2020-05-26 23:33:53 2576

原创 es之search after

一,问题es的分页查询基于from/size,存在深度分页问题。比如from=10000,size=10时,es会从每个分片取出(10000 + 10)条记录,如果有10个分片,则总共要取出(10000 + 10)*10条数据,协调节点在内存中对这些数据进行排序,最终返回10条数据。这种方式会耗费大量的系统资源,包括时间和空间。二,search aftersearch after可以解决这个问题,search after会记住每次分页查询在每个分片的最后位置,当下一次查询时,会从上一次查询结束的位

2020-05-26 23:11:46 4564

原创 es:聚合查询demo

GET kibana_sample_data_ecommerce/_search{ "size": 0, "aggs": { "ggg": { "terms": { "field":"day_of_week_i" }, "aggs": { "ststs": { "stats": { "field":"day_of_week_i" } }

2020-05-26 08:11:13 249

原创 es:query and fetch

一,query and fetch1, 原理查询时,先根据条件在所有分片上查询满足条件的id,汇总到coordinate node上进行汇总排序,然后根据选出的id到各node上获取数据。2,问题一:深度分页3,问题二:数据量少分片多时的算分不准...

2020-05-25 23:25:33 969

原创 idea类注释和方法注释模板设置

一,类注释设置/** * * *@description: *@author: your name *@time: ${DATE} ${TIME} * */二,方法注释1,新增template group2,新增方法模板3,编辑模板属性第5步,配置如下:

2020-05-25 10:44:07 724

原创 es脑裂问题

es集群中只能有一个master节点和多个master候选节点。集群工作过程中,由于网络通信原因,在其他节点无法与master节点通信时,按照es的规则,会选举出一个新的master节点。有可能出现这样一种情况,部分节点能正常与master通信,部分不能正常通信。不能正常通信的节点会选举一个新的master节点,这样会出现同时存在两个master节点,集群有了两个大脑,这就称之为脑裂。避免脑裂:主节点不要作为数据节点,数据节点不要具备选举功能,不少于3个节点具备成为主节点的资格,多余(n/2 + 1)

2020-05-25 08:06:56 1981

原创 Elasticsearch unassigned shards的解决之道

elasticsearch 出现yellow 分片有unassigned现象原因如何处理elastic search中的unassigned shards?

2020-05-24 22:55:32 1853

原创 es之suggest

没太搞明白suggest的原理GET kibana_sample_data_ecommerce/_search{ "suggest": { "term-suggestion": { "text": "ddie", "term": { "field": "customer_first_name", "prefix_length":0, "suggest_mode":"always" } } }}

2020-05-24 16:08:51 2095

原创 function_score和一致性随机函数

一,function_score使用function score 来调整查询结果的算分,影响的是查询结果的顺序。比如根据下面的配置,算分的计算方法:新的算分=旧的算分+log(1 + factor*total_quantity)GET kibana_sample_data_ecommerce/_search{ "query": { "function_score": { "query": { "multi_match": { "query

2020-05-24 09:16:35 362

原创 es之search template

1,创建一个templatePOST _scripts/tmplate_search_1{ "script":{ "lang": "mustache", "source": { "_source":["customer_full_name", "customer_last_name","manufacturer"], "size":20, "query":{ "multi_match":{ "query":"{{

2020-05-23 15:31:12 254

原创 阿里云es安装ik分词器

1,在es的目录下执行命令注意要选择和es一致的版本号./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.3.0/elasticsearch-analysis-ik-7.3.0.zip2, 安装成功后,重启es3,验证GET _analyze{ "analyzer": "ik_max_word", "text": "北京是首都"}

2020-05-23 14:36:15 874

原创 ES之单字符串多字段查询:multi_match

在es的查询中,有两个指标非常重要,一是准确率,查询到的结果集中包含的正确结果数占比;二是召回率,就是查到的结果集中正确结果在所有正确结果(包含查询到的和未查询到的)中的占比。在单字符串多字段查询过程中,考虑到正确率,就是要把匹配度最高的放在最前面;考虑到召回率就是就可能多的把相关文档都查出来。在es中,multi_match就是针对单字符串多字段查询的解决方案,包括三种查询:best_fields,most_fields,cross_fields。一,best_fields多字段查询中,单字段匹配

2020-05-23 11:06:01 8037

原创 ES单字符串多字段查询: disjunction max query

当需要对同一个字符串在多个字段中进行查询时,用bool查询在算分时会多个查询结果的算分进行平均,而实际上有可能我们需要的是最匹配的那个字段对应的那条记录,这个时候就可以用到disjunciton max query 了。一,插入演示数据PUT dis_max_index/_bulk{"index":{"_id":1}}{"title":"apple key", "name":"i like iphone"}{"index":{"_id":2}}{"title":"2 key", "name":"

2020-05-22 23:58:14 1452

原创 es相关性和相关性算法

1,插入测试数据PUT testscore/_bulk{"index":{"_id":1}}{"name":"i like elastic search", "content":"elastic search is a great tool"}{"index":{"_id":2}}{"name":"elastic search", "content":"elastic search is a great tool, i will not give up studying it"}2,相关性de

2020-05-22 21:26:58 490

原创 ES之结构化查询

结构化查询就是对结构比较精确的值的查询,es中对bool、数字、date的查询都是结构化查询。包括term查询、range查询PUT struct_query_index/_bulk{"index":{"_id":1}}{"price":10,"available":true,"productDate":"2010-10-10","productId":"PK-45TKY-90"}{"index":{"_id":2}}{"price":19,"available":true,"productDat

2020-05-22 21:01:38 562

原创 es之index template 与dynamic template

一,index template根据实际业务场景预先创建索引创建的模板,这样在创建索引时不需要指定_setting和_mapping,对于需要频繁创建索引的场景是非常有效的。可以创建多个 index_template,在创建索引时会根据pattern和order进行匹配和合并。以下面的两个模板为例:模板1:PUT _template/default_template{ "index_patterns":["*"], "order":0, "version":1, "set

2020-05-21 23:47:08 558

原创 搭建elasticsearch7.2集群

1,下载es2,安装es3,修改配置3.1 node-name3.2 cluster-name3.3 hosts3.4 ip3.5 网络策略3.6 节点类型3.7按步骤安装ES集群

2020-05-21 18:04:04 801

原创 阿里云服务器安装软件

1,jdkyum install -y java-1.8.0-openjdk.x86_64安装目录是:/usr/lib/jvm2,安装elaswget -c https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.2.0-x86_64.rpm

2020-05-18 08:19:24 664

原创 Field injection is not recommended

Service中使用Autowired注入field,会有浅灰色的警告。spring团队认为field可以分为强关联引用和弱关联引用,这两种不同的引用应该采用不同的注入方式。强关联引用的推荐注入方式(构造器注入):final UserDao userDao;@Autowiredpublic UserServiceImpl(UserDao userDao) { this.userDao = userDao;}弱关联引用的推荐注入方式(set方法注入): private UserDa

2020-05-12 22:28:35 206

sqopp1.4.6.zip

sqopp1.4.6是常用的hadoop生态圈的数据采集、数据同步工具

2021-11-28

hudi-spark3-bundle_2.12-0.10.0-SNAPSHOT.jar

spark读取hudi,hudi版本0.10

2021-11-27

2.Hadoop-lzo.7z lzo源码+包

hdfs默认不支持lzo压缩,需要通过将lzo源码融入hadoop源码,重新编译hadoop源码;或者编译lzo源码生成jar,作为插件使用

2021-11-21

bank_record.csv

hbase bluk load测试数据

2021-06-03

MomoHbase.7z

学习hbase使用的数据制作工具,仿照momo聊天数据格式

2021-06-01

squirrelsqlclientxz.7z

数据连接客户端,连接phoenix 安装方式: java -jar D:\software\sqlc_41579\squirrelsqlclientxz\squirrel-sql-3.7.1-standard.jar

2021-06-01

hadoop2.7.5-Windows版.zip

编译过的Hadoop2.7.5windows版本,拿来即用,内含hadoop.dll、winutils.exe等,还有说明文档:https://blog.csdn.net/epitomizelu/article/details/115717801

2021-04-15

nffaoalbilbmmfgbnbgppjihopabppdk.zip

适合chrome的倍速播放器

2021-03-19

kibana-7.2.0-linux-x86_64.tar.gz.zip

kibana-7.2.0-linux-x86_64.tar.gz官网免费

2021-01-16

20191107141751chromecj.com.zip

Forest电脑版是一款非常有趣的培养专注高效率生活习惯软件

2019-11-07

java多线程设计模式

java多线程设计模式,12个重要的线程设计模式和全书总结以及丰富的附录内容。每一章相关线程设计模式的介绍,都举一反三使读者学习更有效率。最后附上练习问题,让读者可以温故而知新,能快速地吸收书中的精华,书中最后附上练习问题解答,方便读者学习验证。

2016-01-23

基于GIS的数量方法与应用(附书实验文档1)

基于GIS的数量方法与应用(附书实验文档的第一部分),文档重现了书中的每个案例的详细步骤,是Arcgis入门和空间分析入门必备之书

2016-01-23

基于GIS的数量方法与应用(附书数据)

基于GIS的数量方法与应用(附书数据),王法辉教授的著作,适合Arcgis和空间分析的入门

2016-01-23

空间数据分析与R实践

R具有两大功能统计计算和制图。以往空间数据分析是GIS软件的领地,其他软件很少染指。R很早就具有空间数据分析的功能,但是少为人所知道。这本书是由R核心开发组中负责开发空间数据分析的人士边写软件同时边著就的教材。

2016-01-05

R语言编程艺术

R语言编程艺术,内容清晰,有目录,适合入门,无私分享

2015-12-18

Search Everything

对windows的文件系统进行索引,可以快速查找文件系统中的文件和目录,比Windows自带的查找功能块1万倍

2015-12-16

统计建模与R软件

统计建模与R软件,非常经典的r入门书籍,共享

2015-12-16

winscp516setup.exe

这是window文件系统和linux文件系统远程通信的工具,可以用来在两个文件系统间互传文件

2014-12-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除