昨天尝试配置了一个graphrag,也看了各种教程,都有这样那样的问题,所以我总结一个简单的教程。
1、环境检查
部署的操作系统:centos 7.9 64位 (windows貌似总报错,建议用linux)
python版本:3.10 (官方要求python版本需要3.10-3.12)
2、安装graphrag
pip install graphrag
3、配置
3.1 新建文档存放目录
mkdir -p ./ragtest/input
3.2 文档里存放文件
curl https://www.gutenberg.org/cache/epub/24022/pg24022.txt > ./ragtest/input/book.txt
可以放其他文件,注意,必须是txt文件,为了避免在建知识图谱的时候耗时,保证跑通的时候,文件很小。
3.3 项目框架生成
python3 -m graphrag.index --init --root ./ragtest
因为我的python命令是python2,所有我用的python3,如果你们的python就是3版本,就不用python3了。
结束后,能看见生成了项目框架
3.4 修改配置文件
在生成的ragtest文件夹下,需要修改两个配置文件。
请先申请opanai api key ,不然就不需要往下看了。申请问题可以联系我。
3.4.1 修改.env文件
3.4.2 修改settings.yaml文件
红色圈出的部分,可以按照我的修改。
注意:
1、模型使用最新的gpt-4o-mini是最便宜的。土豪忽略;
2、下期再出ollama的免费教程。
3、国内使用openai接口,api地址可以使用这个代理的地址。
4、 初始化运行生成知识图谱
python3 -m graphrag.index --root ./ragtest
运行完后,如果不报错提示成功,就说明知识图谱生成完毕了:
5、 运行测试效果
python3 -m graphrag.query --root ./ragtest --method global "闰土讲了几件有趣的事情?"
结果如下:
好啦,至此graphrag就结束了,大家按照我的教程做,应该是没有问题的。给好几个人装过了。