样本数据集
现在,我们已经了解了基础知识,让我们尝试在一个更现实的数据集上工作。我准备了一个有关客户银行帐户信息的虚拟JSON文档样本。每个文档具有以下架构:
{
"account_number": 0,
"balance": 16623,
"firstname": "Bradshaw",
"lastname": "Mckenzie",
"age": 29,
"gender": "F",
"address": "244 Columbus Place",
"employer": "Euron",
"email": "bradshawmckenzie@euron.com",
"city": "Hobucken",
"state": "CO"
}
出于好奇,此数据是使用www.json-generator.com/
生成的,因此请忽略数据的实际值和语义,因为它们都是随机生成的。
加载样本数据集
您可以从此处下载示例数据集(accounts.json)。将其解压缩到当前目录,然后将其加载到集群中,如下所示:
curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_doc/_bulk?pretty&refresh" --data-binary "@accounts.json"
curl "localhost:9200/_cat/indices?v"
以及响应:
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
yellow open bank l7sSYV2cQXmu6_4rJWVIww 5 1 1000 0 128.6kb 128.6kb
这意味着我们已经成功地将1000个文档批量索引到银行索引(在_doc
类型下)中。