- 博客(612)
- 资源 (21)
- 收藏
- 关注
原创 大模型代理框架AutoGen_实战篇
这里的工具是指预定义功能,而不是在对话中由 LLM 编写的代码。工具必须至少向两个代理注册,才能在对话中发挥作用。选择工具:向 AssistantAgent 注册,告诉 LLM 这些工具可供使用,由 LLM 判断何时调用它,并将输入信息转换为工具需要的格式。执行工具:向 UserProxyAgent 注册,让 UserProxyAgent 可以运行该工具。也可以使用 autogen.register_function 函数同时向两个代理注册工具。
2024-09-22 11:34:47 1025
原创 论文阅读_检索增强生成 RAG 综述
探讨检索增强生成(RAG)作为解决大型语言模型(LLMs)遇到的挑战的有效方法,以提高生成的准确性和可信度,特别是对于知识密集型任务。
2024-09-08 14:19:13 1393
原创 阿里开源的音频模型_原理与实操
方法:引入两个创新模型:SenseVoice 处理多语言语音识别、情感识别和音频事件检测;CosyVoice 促进多语言语音生成,具有对多种语言、音色、说话风格和说话人身份的控制。结论:SenseVoice-Small 为 中文、英文、粤语、日文、韩文 5 种语言提供极低延迟的 ASR,性能比 Whisper-small 快 5 倍以上;
2024-07-20 14:50:52 2033
原创 论文阅读_基本于文本嵌入的信息提取
目标: 解决农民难以准确识别害虫的问题。探索使用领域无关的通用预训练大型语言模型(LLM)从农业文档中提取结构化数据,以实现无人或最小干预。
2024-06-29 17:17:26 1134
原创 Obsidian+llama3:终于搭建了自己的知识库
Obsidian 的 Smart Connections,超出了我原本的预期,于是结合新模型非常方便地搭建了我的个人知识库。
2024-05-19 17:35:48 1781 1
原创 论文阅读_大模型优化_YOCO架构
提出名为 YOCO 的 Self Decoder + Cross Decoder 架构。主要用于优化大型语言模型,其特点是只缓存一次键值对。
2024-05-19 17:32:42 1421
原创 为啥现在用大模型这么便宜
这两篇论文都是五月初提交 arxiv 的,实验结果证明,改进 KV 存储后可以解决 GPU 内存的瓶颈问题,从而降低成本。
2024-05-19 17:28:36 805
原创 五行命令搭建llama3环境
本文将介绍 ollama+llama3 的最基本的安装和使用方法。只要你的 GPU 和 Docker 环境可用,基本上只需不超过五行的命令就能完成(实际上可能只需要一行)。
2024-05-19 17:25:20 1007
原创 论文阅读_使用有向无环图实现流程工程_AgentKit
前几天,和朋友讨论了如何让 Agent 自我构建知识体系,自我进化。刚好看到了这篇论文,作者对 Agent 结构进行了更为深入和丰富的思考,并提出了流程工程,或者思维工程的概念。
2024-05-05 16:08:24 1137
原创 论文阅读_RAG融合现有知识树_T-RAG
开发一个可以安全、高效地回答私有企业文档问题的大型语言模型(LLM)应用程序,主要考虑数据安全性、有限的计算资源以及需要健壮的应用程序来正确响应查询。
2024-05-05 16:07:10 1396
原创 CAMEL:大型语言模型社会的“心智”探索沟通代理
以往的工作流程主要通过人与 LLM 的交互来控制。文中作者使用一个 Agent 来取代人的计划和决策,而另一个 Agent 负责执行具体的操作。
2024-04-29 17:39:08 1275
原创 开源项目实现简单实用的股票回测
尝试用 50 行代码完成一个简单的股票回测工具。输入的数据是 A 股的股票代码和时间,通过工具抓取股票数据。然后编写了策略,并使用回测工具来展示策略在数据上的具体操作和盈亏。
2024-04-21 10:43:10 1216
原创 开源AI程序员SWE-Agent的实现方法
一个类似功能的产品 SWE-Agent 开源,在 SWE-Bench 上实现了与 Devin 类似的效果。
2024-04-07 15:29:52 1369
原创 强化学习+大模型_总结篇
将生成和强化学习结合起来是解决这个问题的一种思路,强化学习通过奖励函数直接或间接地为模型提供有监督的判定标准。因此,在大模型中引入强化学习可以提升其判断能力。
2024-03-24 11:05:59 1437
原创 大模型+强化学习_通过强化学习对齐大模型和环境
由于知识与环境不一致,通用的大型语言模型(LLMs)经常无法解决简单的决策任务。相反,强化学习(RL)智能体从头开始学习策略,与环境保持一致,但很难结合先验知识进行有效探索。本文旨在结合两个优势。
2024-03-23 16:54:36 1546
原创 大模型+强化学习_在线交互调参_GLAM
旨在对齐大型语言模型(LLM)的知识与环境,并研究这种对齐对提高在线强化学习任务的效率以及提升不同形式的泛化的影响。
2024-03-23 16:52:27 900
原创 大模型+强化学习_利用AI反馈扩展强化学习_RLAIF
探索使用 RLAIF (RL from AI Feedback (RLAIF) 方法替代 RLHF 方法,以提高大型语言模型与人类偏好的一致性。
2024-03-23 16:48:19 884
android文件管理器源码
2011-07-06
android将lib库打包成apk安装
2010-11-18
Android使用XML-RPC实现blog客户端源码
2010-10-29
MSN博客搬家工具的可执行程序和源码
2010-10-21
学习java编程(二)
2009-10-13
学习java编程(一)
2009-10-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人