es不同查询方法的比较

from elasticsearch import Elasticsearch
from elasticsearch import helpers
gol_index_name = "索引名称"
es_client = Elasticsearch(["ip"], http_auth=('用户名', '用户名密码'), port=9200)
es_search_options = {"query": {"match_all": {}},"size":10000}
    s1 = datetime.datetime.now()
    es_result = es_client.search(index=gol_index_name, doc_type="vulnerability", body=es_search_options)
    fianl_result = []
    for i in es_result["hits"]["hits"]:
        fianl_result += i["_source"]
    print("aaaa", datetime.datetime.now()-s1)
    es_search_options = {"query": {"match_all": {}}, "from":0,"size": 1000}
    s1 = datetime.datetime.now()
    fianl_result1 = []
    for i in range(10):
        es_search_options["from"] = i*100
        es_result = es_client.search(index=gol_index_name, doc_type="vulnerability", body=es_search_options)
        fianl_result1.extend(es_result["hits"]["hits"])
    print("bbbbb", datetime.datetime.now() - s1)
    scroll_id_op = {"query": {"match_all": {}}}

    s1 = datetime.datetime.now()
    page = es_client.search(index=gol_index_name, doc_type="vulnerability", body=scroll_id_op, scroll="1m", size=100,
                            timeout="3m")
    sid = page['_scroll_id']
    scroll_size = page['hits']['total']
    # print(scroll_size)
    final_result = []
    final_result += [x['_source'] for x in page['hits']['hits']]
    i = 1
    while scroll_size > 0:
        if i >= 101:
            break
        page = es_client.scroll(scroll_id=sid, scroll='2m')
        # Update the scroll ID
        sid = page['_scroll_id']
        scroll_size = len(page['hits']['hits'])
        docs = page['hits']['hits']
        final_result += [x['_source'] for x in docs]
        i += 1
    print("ccccc", datetime.datetime.now() - s1)

以上只查询1万条数据,search可以实现(es默认10000条,如果超出,这不试用,但是这个默认查询的最大值1万可以修改) 单纯用search会比较节省时间

如果大于1万条数据或者大于咱们设置的search查询的最大阈值时用下两种方式可以实现查询, 不过都不能排序和实现web端的分页:  

page = es_client.search(index=gol_index_name, doc_type="vulnerability", body=scroll_id_op, scroll="1m", size=100,
                            timeout="3m")

es_result = helpers.scan(
        client=es_client,
        query=es_search_options,
        scroll='1m',
        index=index_name,
        doc_type="vulnerability",
        timeout='1m'
    )

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
ElasticsearchES)提供了多种查询方式,可以根据不同的需求和场景选择合适的查询类型。常用的ES查询方式包括: 1. Match Query(匹配查询):根据指定的字段和值进行全文匹配查询。可以使用match查询来搜索包含指定词条的文档。 2. Term Query(精确查询):根据指定的字段和精确值进行查询。term查询是在某个字段中寻找包含精确值的文档。 3. Range Query(范围查询):根据指定字段和范围值进行查询。可以使用range查询来搜索在指定范围内的文档。 4. Bool Query(布尔查询):将多个查询条件进行逻辑组合,可以使用must、must_not、should等关键词来组合查询条件。 5. Wildcard Query(通配符查询):使用通配符模式进行匹配查询。可以使用通配符(*和?)来匹配文档中的一部分内容。 6. Fuzzy Query(模糊查询):根据指定的值进行模糊匹配查询。可以使用fuzzy查询来搜索与指定值相似的文档。 以上是一些常用的Elasticsearch查询方法,可以根据具体需求选择合适的查询方式来进行数据检索。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Elasticsearch的多种查询方式](https://blog.csdn.net/weixin_42039228/article/details/131513436)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [spring 操作elasticsearch查询使用方法](https://download.csdn.net/download/weixin_38631960/12780046)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值