Elasticsearch Python 集成:从基础搜索到机器学习应用
1. 批量索引与标准搜索
1.1 批量索引
在 Elasticsearch 中执行批量索引时,其客户端提供了一个辅助函数。该函数接受连接、可迭代的文档列表和批量大小作为参数。批量大小默认值为 500,它定义了通过单个批量调用发送的操作数量。要正确控制文档索引所需传递的参数,需以 _ 为前缀放置在文档中。提供给批量索引器的文档必须格式化为标准搜索结果,主体位于 source 字段中。示例代码如下:
from elasticsearch.helpers import bulk
bulk(es, [
{"_index": index_name, "_id": "1",
"source": { "name": "Joe Tester",
"parsedtext": "Joe Testere nice guy",
"uuid": "11111", "position": 1,
"date": datetime(2018, 12, 8)}},
{"_index": index_name, "_id": "1",
"source": {"name": "Bill Baloney", "parsedtext": "Bill Testere nice guy", "uuid": "22222", "position": 2,
"date": datetime(2018, 12,
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



