关于elaticsearch中更新数据的几种方式

作为一个成熟的框架,Elasticsearch里面提供了丰富的操作数据的api,本篇我们就来学习一下在es中更新数据的几种方式。


(一)更新文档

(1)部分更新:

java api:
````
` HashMap<String,Object> data=new HashMap<>();
data.put("name","woshigcs");
data.put("age",25);
UpdateRequestBuilder urb= client.prepareUpdate("active2018-03-21", "active", "18");
urb.setDoc(data);
urb.execute().actionGet();

System.out.println("update ok......");
````


注意部分更新功能,前提是索引和该条数据已经存在,否则会抛出对应的异常,只要任何一个不满足,都会更新失败。

curl:
````
curl -XPOST 'localhost:9200/test/type1/1/_update' -d '{
"doc" : {
"name" : "new_name"
}
}
````



(2)使用detect_noop

java api:
````
` HashMap<String,Object> data=new HashMap<>();
data.put("name","woshigcs");
data.put("age",25);
UpdateRequestBuilder urb= client.prepareUpdate("active2018-03-21", "active", "18");
urb.setDoc(data);
urb.setDetectNoop(false);//默认是true
urb.execute().actionGet();

System.out.println("update ok......");
````

curl方式:

````
curl -XPOST 'localhost:9200/test/type1/1/_update' -d '{
"doc" : {
"name" : "new_name"
},
"detect_noop": false
}'

````
注意detect_noop的意思:

默认情况下detect_noop=true

默认情况下只有原来的source和新的source存在不同的字段情况下才会重建索引,如果一模一样是不会触发重建索引的,如果将detect_noop=false不管内容有没有变化都会重建索引,这一点可以通过version的值的变化来发现


更新的文档,必须提前存在,除非你用upset+script来更新,否则会报document
missing异常


(二)script + upset更新方式:


java api
````

` HashMap<String,Object> params=new HashMap<>();
HashMap<String,Object> data=new HashMap<>();
data.put("name","12345");
params.put("source",data);

StringBuffer sb_json = new StringBuffer("ctx._source=source");
Script script = new Script(sb_json.toString(), ScriptService.ScriptType.INLINE, "groovy", params);
UpdateRequestBuilder urb= client.prepareUpdate("active2018-03-11", "active", "16");
urb.setScript(script);
urb.setUpsert(data);
urb.execute().actionGet();
System.out.println("更新完事。。。。。。 ");

````

curl
````
curl -XPOST 'localhost:9200/test/type1/1/_update' -d '{
"script" : {
"inline": "ctx._source.counter += count",
"params" : {
"count" : 4
}
},
"upsert" : {
"counter" : 1
}
}'
````



(三):scripted_upsert用法:

官网个的例子没有跑通,下面这个是按照stackoverflow上面的例子改写的,可以通过

在postman里面已经跑通:

首先是在post请求的url

java api:

````
` HashMap<String,Object> params=new HashMap<>();
HashMap<String,Object> data=new HashMap<>();
data.put("name","12345");

HashMap<String,Object> newdata=new HashMap<>();
newdata.put("name","789");

params.put("data",data);
params.put("newdata",newdata);


StringBuffer sb_json = new StringBuffer("if (ctx.op == \"create\") ctx._source=data; else ctx._source=newdata");
Script script = new Script(sb_json.toString(), ScriptService.ScriptType.INLINE, "groovy", params);
UpdateRequestBuilder urb= client.prepareUpdate("active2018-03-11", "active", "16");
urb.setScript(script);
urb.setScriptedUpsert(true);
urb.setUpsert("{}");//必须有这个值,否则会报document missing exception
urb.execute().actionGet();
System.out.println("更新完事。。。。。。 ");
````



curl方式

````
http://192.168.201.5:9200/active2018-03-11/active/11/_update
````


然后是下面的body里面选择raw然类型是JSON(application/json):
````
{
"scripted_upsert":true,
"script" : {
"script":"if (ctx.op == \"create\") ctx._source=data; else ctx._source=newdata ",
"params" : {
"data":{
"ct":11,
"aid":"a22",
"tid":"t11"
},
"newdata":{
"ct":1000,
"aid":"a2qq2",
"tid":"qq"
}
}

},
"upsert" : {}
}
````
执行上面的脚本,首先会检查索引是否存在,如果不存在就会新建一个索引,然后会判断id等于11这条数据存在不存在,如果不存在就把data里面的数据作为第一次的插入数据,如果已经存在就会把原来的数据删除掉然后把newdata的数据插入进去,可以理解就是更新。这里需要注意,如果用的是动态mapping,需要注意数据的类型,动态mapping下两条数据里面的同一个字段可以拥有不同的类型,这样既灵活又带来了风险,所以对于严谨类型的数据推荐使用静态mapping,严格限定字段的类型。


(四)doc_as_upsert方式:

这个方式其实就是前面两个的简洁版,意思就是没有就插入有就覆盖,注意这是是覆盖并不是把原来的删除在插入,而且如果是动态mapping还可以改变字段的类型,但不建议这么用。

java api:

````
` HashMap<String,Object> data=new HashMap<>();
data.put("name","234");
data.put("age",123);
data.put("address","北京海淀区");
UpdateRequestBuilder urb= client.prepareUpdate("active2018-03-11", "active", "16");
urb.setDoc(data);
urb.setDocAsUpsert(true);

urb.execute().actionGet();//
System.out.println("操作成功......");
````


curl方式:

````
http://192.168.201.5:9200/active2018-03-11/active/12/_update
{
"doc" : {
"name" : "6755",
"age":12,
"address":"北京朝阳"

},
"doc_as_upsert" : true
}
````



总结:


上面更新操作es几种方法,总体来说使用script更新的方式最强大,可以做一些复杂业务场景的操作,如数值的累增或者操作集合对象元素的追加或者删除,其他的几种方式适合简单的更新操作。

不管使用那种更新方式,我们都需要考虑并发问题,通过前面一系列的文章的介绍,我们知道es里面的更新,删除,都是伪操作,尤其是更新,在es内部的实际处理流程是:

(1)查询旧的document数据

(2)修改成最新的数据

(3)然后重建整条document


在这里的三个阶段,如果同时又另外一个进程也在修改该条数据,就会发生冲突,es里面是根据version字段来判断是否冲突的,在上面的步骤中的第一步查询旧的数据会得到version字段,在第三步时候写的时候会把这个version字段在传回,这个时候如果发现version不一致就会发生冲突然后抛出异常,所以大家在使用的时候可以优先通过设计避免多线程操作,如果实在没法避免则可以使用es里面的提供的version字段来通过乐观锁控制并发问题,如果操作是简单的累加或累减还可以用更简单的方法冲突重试来解决并发问题,一句话就是具体场景具体分析,关于es并发问题后面有空可以单独再整理一篇文章出来。


[b][color=green][size=large] 有什么问题可以扫码关注微信公众号:我是攻城师(woshigcs),在后台留言咨询。 技术债不能欠,健康债更不能欠, 求道之路,与君同行。 [/size][/color][/b] [img]http://dl2.iteye.com/upload/attachment/0104/9948/3214000f-5633-3c17-a3d7-83ebda9aebff.jpg[/img]
Elasticsearch更新数据几种方式。其一种方式是通过将旧文档标记为已删除,并增加一个全新的文档来更新数据。虽然无法直接访问旧版本的文档,但它们并不会立即消失。随着索引更多的数据Elasticsearch会在后台清理这些已删除的文档。 另一种方式是使用ElasticSearch提供的丰富的操作数据的API来更新数据。可以使用相同的index API进行实现,通过执行PUT请求来替换现有的文档。这意味着无法直接修改文档,而是需要通过重建索引或替换的方式更新文档。例如,可以执行以下请求来更新文档:PUT /website/blog/123 { "title": "My first blog entry", "text": "I am starting to get the hang of this...", "date": "2014/01/02" }<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [elasticsearch 更新修改数据(添加和删除字段等)](https://blog.csdn.net/qq_36951116/article/details/113353034)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [关于ElasticSearch更新数据几种方式](https://blog.csdn.net/weixin_38809962/article/details/79768002)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值