想法
大语言模型已经火了大半年,想搭建一个定制化的AI助手,可以更专业的帮助我完成各项任务,或者简单理解为某个领域的AI专家。
主业是做AI算法用到的嵌入式模块的,所以目前没有太多AI的知识,在这里记录一下进度,路过的友友可以指导交流下,不胜感激~
思路
研究了两周相关的技术,目前的理解和思路是这样的:
1. 需要RAG,可以让LLM在RAG中给出专业的回答。RAG里面关于如何把切割后的文档转成向量,存在向量数据库,还不清楚原理。
2. 加强的话第二步考虑finetune,这个过程可能需要带GPU的服务器,不知道费用是否很昂贵
3. 最后是RHLF,可以不断优化结果
状态
1. 从github上面找到了一个开源项目https://github.com/zilliztech/akcio/blob/main/pics/osschat.png,可以比较傻瓜的实现这个功能,调试的过程中发现还需要注册zilliz,所以breakdown了一下任务
steps | status |
了解项目 | done |
下载code,搭建编译环境 | done |
注册zilliz | TBD |
获取LLM的key | TBD |
尝试运行 | TBD |
2. 也可以使用langchain框架自己搭,找了一篇文章准备尝试使用LangChain和Mistral 7B构建医疗问答系统 - 知乎