阿丹:
当前生成式的ai对于企业的痛点是需要将数据通过上传网络的方式来给生成式的ai进行理解和短暂的学习。
我开始写的这个项目,我是属于一个门外汉。作为一个后端开发来进行完整的项目从0-1。
本项目主要解决的痛点问题就是:
1、保证企业数据安全,在文档的生成以及调用的时候。完全离线并本地化。
2、使用提示词保证回答在可控制的范围内。
3、使用向量检索来完成专业知识提供以及数据支撑。
本系列会持续更新。
整体选型:
模型框架:
文档加载器# – LangChain中文网
LangChain 是一个开发由语言模型驱动的应用程序的框架。
大模型版本:
ChatGLM
GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
因为要实现完整的本地运行,就需要将大模型放到本地来使用。
开发语言
python+java
python原因:
1、python是用