bulk批量索引
bulk
用于在一个API调用中执行多个索引或删除操作. 这减少了开销, 并可以极大地提高索引速度.
bulk API
语法格式如下:
action_and_meta_data\n
optional_source\n
action_and_meta_data\n
optional_source\n
....
action_and_meta_data\n
optional_source\n
action包括:
-
index(索引)
索引要求下一行有数据, 该操作用于新增或替换document
-
create(创建)
创建要求下一行有数据, 该操作用于新增document, 如果document已存在则该操作失败
-
update(更新)
更新要求下一行有数据, 用于更新document
-
delete(删除)
删除时不需要下一行
注意: 最后一行数据必须以换行字符\n结束. 每个换行字符的前面可以有一个回车\r. 当向_bulk端点发送请求时, 应该将Content-Type头设置为application/x-ndjson
测试bulk
-
从官方下载 accounts.json 示例数据.
wget -O accounts.json https://github.com/elastic/elasticsearch/blob/master/docs/src/test/resources/accounts.json?raw=true
这是一些随机生成的银行账户信息, 格式如下:
{ "index":{ "_id":"1"}} { "account_number":1,"balance":39225,"firstname":"Amber","lastname":"Duke","age":32,"gender":"M","address":"880 Holmes Lane","employer":"Pyrami","email":"[email protected]","city":"Brogan",