Tiny-Universe的一些解读

最新推荐文章于 2024-09-26 17:20:50 发布

Dominiczz

最新推荐文章于 2024-09-26 17:20:50 发布

阅读量244

点赞数 1

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40896190/article/details/141164741

版权

深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

TinyAgent

关键代码

def text_completion(self, text, history=[]):
    text = "\nQuestion:" + text
    response, his = self.model.chat(text, history, self.system_prompt)
    print(response)
    plugin_name, plugin_args, response = self.parse_latest_plugin_call(response)
    if plugin_name:
        response += self.call_plugin(plugin_name, plugin_args)
    response, his = self.model.chat(response, history, self.system_prompt)
    return response, his

总结：

首先对输入文本加一个"question"前缀，然后送入model得到response、his
self.system_prompt就是事先人为构造好的prompt格式
然后再从response里面拿到plugin_name, plugin_args, response
如果有plugin_name就调用插件（tool）将结果拼接到response末尾
最后再送入model拿到结果

TinyRAG

datawhale这块程序写的有一点问题，就总结一下大概思路吧
在这里插入图片描述具体操作细节可以看官网文档的readme.md
RAG的五个部分

向量化模块
文档加载和切分模块
数据库
向量检索
大模型模块

一般来说，RAG具体流程可以总结如下：

将输入文本text经过embedding后转vectors存着
同样的将query经过类似操作得到vector，然后计算第一步得到的vectors之间的余弦相似度，返回k个最接近的
再输入给LLM得到结果

感觉主要问题就在embedding和retrieval这两部分，前者貌似一般都有开源的embbeding model，顶多再微调一下，而后者着重向量的构建，检索速度的优化？

2024/8/13更新

后面有空再去看一下有道QAnything，感觉是一个不错的RAG实践。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。