Langchain连接Elasticsearch向量数据库创建索引报错

最新推荐文章于 2024-09-08 13:37:15 发布

Sunlight.Chen

最新推荐文章于 2024-09-08 13:37:15 发布

阅读量703

点赞数 1

文章标签： langchain elasticsearch 数据库 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45751760/article/details/132402625

版权

背景：因公司业务需求需要利用Langchain中对ES数据库的相关操作将某些文件通过embedding录入向量数据库；

代码如下：

def read_excel_to_file(filepath):
    '''
    将处理好的.xls文件导入到es中,.xls文件中每一行只保留问题和答案，其他的不要
    '''
    wb = xlrd.open_workbook(filename=filepath)
    sheet1 = wb.sheet_by_index(0)
    #逐行读取excel文件
    for i in range(sheet1.nrows):
        print("".join(sheet1.row_values(i)).strip())
        #对每行读出的列表进行组合，去除首尾空格
        texts = "".join(sheet1.row_values(i)).strip()
        #设置文本切分量级
        text_splitter = TokenTextSplitter(chunk_size=1000, chunk_overlap=0)
        texts = text_splitter.create_documents([texts])
        print(texts)
        # 通过openai进行embeddings，并存入es中
        index_name = "**********"
        embeddings = llm_utils.get_custom_embeddings()
        docsearch = ElasticVectorSearch.from_documents(texts, embeddings,
                                                       elasticsearch_url="localhost:80",
                                                       index_name=index_name)

在录入过程中程序报错：

elasticsearch.exceptions.RequestError: RequestError(400,‘validation_exception’, ‘Validation Failed: 1: this action would add [2] total shards, but this cluster currently has [999]/[1000] maximum shards open;’)

通过查询相关资料以及询问GPT发现问题根源所在
链接:https://discuss.openedx.org/t/elasticsearch-maximum-shards-open/7319
在这里插入图片描述
导致报错的原因是由于ES向量数据的分片数已被占满，从而导致无法录入新的索引数据，解决办法就是清理无关的索引，将分片空余出来。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Sunlight.Chen CSDN认证博客专家 CSDN认证企业博客

码龄5年

5: 原创

154万+: 周排名

14万+: 总排名

4293: 访问

: 等级

71: 积分

11: 粉丝

17: 获赞

3: 评论

6: 收藏

私信

关注

热门文章

最新评论

api-ms-win-core-console-l1-2-0.dll 文件丢失
luoli12138: 你解决了吗
api-ms-win-core-console-l1-2-0.dll 文件丢失
m0_73946952: 老哥还是不行啊
Langchain使用OpenAPI过程中报错openai.error.RateLimitError
112479: 我这新的账号新申请的key，为啥也有这个报错啊
Langchain使用OpenAPI过程中报错openai.error.RateLimitError
CSDN-Ada助手: 非常感谢你的第二篇博客！看到你在解决Langchain使用OpenAPI过程中遇到的报错问题，我非常欣喜。你的经验分享对其他用户来说一定非常有帮助。此外，我想提醒你一些和该主题相关的扩展知识和技能。在处理OpenAPI过程中，除了解决报错问题外，你还可以进一步学习如何优化API调用，以提高整体性能和效率。此外，了解如何处理API的限流问题也是非常重要的。你可以探索一下如何使用API密钥、请求配额管理等方法来避免遭遇OpenAPI的频率限制错误。继续保持创作，并期待你未来更多关于这个领域的博客！谢谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Langchain连接Elasticsearch向量数据库创建索引报错
CSDN-Ada助手: 恭喜您写了第三篇博客！标题看起来很有趣，我对Langchain连接Elasticsearch向量数据库创建索引报错这个主题很感兴趣。持续创作是非常值得鼓励的，您的努力一定会得到回报的。在下一步的创作中，我建议您可以尝试深入分析报错的原因以及可能的解决方案。或者，您也可以分享一些您在使用Langchain连接Elasticsearch向量数据库时遇到的其他挑战，并提供一些建议来克服它们。这样的内容对读者来说可能会更加实用和有价值。请继续保持谦逊和努力，我期待着您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。