RAGflow一旦开启知识图谱之后,解析非常慢,会发现文档都长时间卡在80-90%
内存直接拉爆。
“Entities extraction progress”:实体抽取进程,这是形成知识图谱的重要过程。
资源限制问题
内存不足:RAGFlow在解析文档构建知识图谱时,需要处理大量数据,若内存不足,会导致处理速度变慢甚至卡住。
磁盘I/O瓶颈:若系统盘空间不足,可能导致解析进程卡住。比如,当系统盘空间使用率过高时,Elasticsearch等服务可能无法正常工作,影响索引构建和解析进度。
数据与配置问题
文档格式与内容问题:若上传的文档格式复杂或包含特殊字符,可能导致解析缓慢。如PDF论文等格式复杂的文件,可能需要更长时间来解析。
知识图谱配置问题:使用了复杂或不适用的命名实体类型配置,增加了实体抽取的难度和时间。应检查知识图谱相关配置,确保其合理有效。
最后解析完毕,非常消耗token:
运行了几天发现,非常消耗硬盘资源:
120G的硬盘,很快就只剩下一点点了。