python连接es库,以及对es库文档内容的存取操作

1、es库连接

from elasticsearch import Elasticsearch
es = Elasticsearch(["x.x.x.x: 9200"])

2、将文档(txt、word、excel)内容存入到es库

存储思路:不同类型的文档设置不同的额索引名称,从es库中查询文档时相对比较方便,将文件名称、文件内容处理成字符串存入到es库

文件内容读取方式:

word文档使用 Document() 方法;txt文档使用open()方法;excel使用 xlrd.open_workbook()方法

3、根据关键字从es库获取到相关文档

将关键字参数放在es.search()方法中即可查询到在哪些文档中出现过该关键字

es.search(index="XX", doc_type="XX", body={"query": {"match": {"word_info": "关键字参数"}}}, filter_path=['hits.hits._source'])

如有不同理解,还请指教。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值