我发现在构建了本地法律知识库的情况下,我们项目的很多功能都会更好实现,因此我们决定一起构建本地法律知识库,这篇博客主要讲法律知识库的设计思路及数据来源,也希望分享的数据来源网站能够帮到别人
首先是设计思路,我在csdn上搜索了知识库和法律知识库,个人浏览下来感觉比较有帮助的是大模型技术|基于大模型构建本地知识库、人工智能法律专业知识库|构建法律知识的基础设施和使用Dify搭建DeepSeek本地知识库,也觉得值得一看,推荐给看到这篇博客的网友,初步打算用dify搭建本地法律知识库,接着先了解了一下dify,Dify零代码ai应用开发:快速入门与实战讲的会比较好,又看了这篇0代码!教会你用Dify+DeepSeek搭建RAG知识库(附完整DSL)
至于知识库组成占比预想如下:
再说到数据来源:
1.法律条文,最简单获取,在国家法律法规数据库就有足够权威的数据,爬虫代码在我的第一篇博客就有,也可参考这篇博客。
2.文书模版,来源可以从广州市番禺区人民法院、法律图书馆和微信公众号最高司法审判的法律文书栏目,前者数据最为权威。
3.典型案例,可以从中国裁判文书网获取。
4.司法解释,也可在国家法律法规数据库或中华人民共和国最高法院公报,前者已在爬取法律条文代码里一起爬取,也可参考我的第一篇博客。
谢谢观看