xieyan0811-CSDN博客

原创论文阅读_大型语言模型增强强化学习调查

这是一篇综述性论文，主要研究 LLM 帮助训练和提升强化学习模型。

2024-10-20 16:20:56 857

这里的工具是指预定义功能，而不是在对话中由 LLM 编写的代码。工具必须至少向两个代理注册，才能在对话中发挥作用。选择工具：向 AssistantAgent 注册，告诉 LLM 这些工具可供使用，由 LLM 判断何时调用它，并将输入信息转换为工具需要的格式。执行工具：向 UserProxyAgent 注册，让 UserProxyAgent 可以运行该工具。也可以使用 autogen.register_function 函数同时向两个代理注册工具。

2024-09-22 11:34:47 1025

原创论文阅读_检索增强生成 RAG 综述

探讨检索增强生成（RAG）作为解决大型语言模型（LLMs）遇到的挑战的有效方法，以提高生成的准确性和可信度，特别是对于知识密集型任务。

2024-09-08 14:19:13 1393

原创 Agent实战

介绍一个很典型的大模型应用场景

2024-08-25 10:09:10 839

原创图形化的Agent工具

介绍两个不需要编程的模型代理实现工具

2024-08-25 10:06:52 912

原创论文阅读_字节的语音生成模型_Seed-TTS

提出 Seed-TTS，一种大规模自回归文本转语音模型，主要用于生成几乎无法区分人类语音的语音。

2024-07-28 20:47:48 745

原创开源的语音合成工具_ChatTTS_用法及资源

ChatTTS 在情绪的可控性显著提升，但对说话人的控制相对较弱。

2024-07-20 14:52:19 1207

原创阿里开源的音频模型_原理与实操

方法：引入两个创新模型：SenseVoice 处理多语言语音识别、情感识别和音频事件检测；CosyVoice 促进多语言语音生成，具有对多种语言、音色、说话风格和说话人身份的控制。结论：SenseVoice-Small 为中文、英文、粤语、日文、韩文 5 种语言提供极低延迟的 ASR，性能比 Whisper-small 快 5 倍以上；

2024-07-20 14:50:52 2033

原创论文阅读_基于嵌入的Facebook搜索

目标: 将嵌入式检索（EBR）应用于 Facebook 搜索系统的技术，以改进搜索结果的相关性。

2024-06-29 17:18:27 1321

原创论文阅读_基本于文本嵌入的信息提取

目标: 解决农民难以准确识别害虫的问题。探索使用领域无关的通用预训练大型语言模型（LLM）从农业文档中提取结构化数据，以实现无人或最小干预。

2024-06-29 17:17:26 1134

原创论文阅读_优化RAG系统的检索

目标：研究 RAG 系统中的检索策略，优化信息检索（IR）组件以提升生成式 AI 解决方案的效果。

2024-06-29 17:15:37 843 1

原创论文阅读_OpenAI嵌入+Lucene

目标: 挑战当前普遍认为需要专门的向量存储才能利用深度神经网络进行搜索的观点。

2024-06-29 17:14:35 1003 2

原创论文阅读_中文嵌入资源 C-Pack

目标: 介绍了 C-Pack，这是一个显著推进通用中文嵌入领域的资源包。

2024-06-29 17:13:10 1293

原创 NLP 中文本表示和嵌入技术的调研

研究如何将输入文本（原始数据）表示为数值格式（向量或矩阵）。

2024-06-29 17:11:46 884

原创语言模型：文本表征&词嵌入技术调研

很多程序员很喜欢拥抱新技术。有很多技术，一开始觉得还真不错，但装上之后，并不经常用。

2024-06-29 17:09:02 873

原创使用辅助编程的一些思考

最近使用辅助编程比较频繁，也在思考

2024-06-29 17:07:39 459

原创 Obsidan插件开发

在开发 Obsidian 插件时，将涉及 JavaScript 和 Node.js 的相关知识。

2024-06-29 17:06:11 1440

原创 Obsidian+llama3：终于搭建了自己的知识库

Obsidian 的 Smart Connections，超出了我原本的预期，于是结合新模型非常方便地搭建了我的个人知识库。

2024-05-19 17:35:48 1781 1

原创论文阅读_大模型优化_YOCO架构

提出名为 YOCO 的 Self Decoder + Cross Decoder 架构。主要用于优化大型语言模型，其特点是只缓存一次键值对。

2024-05-19 17:32:42 1421

原创论文阅读_大模型优化_DeepSeek-V2

DeepSeek-V2 是一个 MoE 语言模型，其特点是经济高效的训练和推理。

2024-05-19 17:30:55 1866

原创为啥现在用大模型这么便宜

这两篇论文都是五月初提交 arxiv 的，实验结果证明，改进 KV 存储后可以解决 GPU 内存的瓶颈问题，从而降低成本。

2024-05-19 17:28:36 805

原创五行命令搭建llama3环境

本文将介绍 ollama+llama3 的最基本的安装和使用方法。只要你的 GPU 和 Docker 环境可用，基本上只需不超过五行的命令就能完成（实际上可能只需要一行）。

2024-05-19 17:25:20 1007

原创论文阅读_管理模型的记忆_MemGPT

解决大型语言模型在处理长对话和文档分析等任务时受到有限上下文窗口限制的问题。

2024-05-19 17:20:44 1177 1

原创论文阅读_使用有向无环图实现流程工程_AgentKit

前几天，和朋友讨论了如何让 Agent 自我构建知识体系，自我进化。刚好看到了这篇论文，作者对 Agent 结构进行了更为深入和丰富的思考，并提出了流程工程，或者思维工程的概念。

2024-05-05 16:08:24 1137

原创论文阅读_RAG融合现有知识树_T-RAG

开发一个可以安全、高效地回答私有企业文档问题的大型语言模型（LLM）应用程序，主要考虑数据安全性、有限的计算资源以及需要健壮的应用程序来正确响应查询。

2024-05-05 16:07:10 1396

原创论文阅读_股票预测强化学习_StockFormer

这里采用了预测编码模型与强化学习的结合方法。

2024-04-29 17:41:47 1930 3

原创 CAMEL：大型语言模型社会的“心智”探索沟通代理

以往的工作流程主要通过人与 LLM 的交互来控制。文中作者使用一个 Agent 来取代人的计划和决策，而另一个 Agent 负责执行具体的操作。

2024-04-29 17:39:08 1275

原创开源工具_Aider_重塑编程体验

大模型辅助编程，增加了代码生成的可控性，一次可以修改多个文件

2024-04-21 10:44:51 1468

原创开源项目实现简单实用的股票回测

尝试用 50 行代码完成一个简单的股票回测工具。输入的数据是 A 股的股票代码和时间，通过工具抓取股票数据。然后编写了策略，并使用回测工具来展示策略在数据上的具体操作和盈亏。

2024-04-21 10:43:10 1216

原创 Obsidian_多文档管理插件Longform

Obsidian_多文档管理插件Longform

2024-04-07 15:31:35 724

原创开源AI程序员SWE-Agent的实现方法

一个类似功能的产品 SWE-Agent 开源，在 SWE-Bench 上实现了与 Devin 类似的效果。

2024-04-07 15:29:52 1369

原创强化学习+大模型_总结篇

将生成和强化学习结合起来是解决这个问题的一种思路，强化学习通过奖励函数直接或间接地为模型提供有监督的判定标准。因此，在大模型中引入强化学习可以提升其判断能力。

2024-03-24 11:05:59 1437

原创大模型+强化学习_通过强化学习对齐大模型和环境

由于知识与环境不一致，通用的大型语言模型（LLMs）经常无法解决简单的决策任务。相反，强化学习（RL）智能体从头开始学习策略，与环境保持一致，但很难结合先验知识进行有效探索。本文旨在结合两个优势。

2024-03-23 16:54:36 1546

原创大模型+强化学习_在线交互调参_GLAM

旨在对齐大型语言模型（LLM）的知识与环境，并研究这种对齐对提高在线强化学习任务的效率以及提升不同形式的泛化的影响。

2024-03-23 16:52:27 900

原创大模型+强化学习_自我对弈偏好优化

提出一种基于模型自我对弈的强化学习算法。

2024-03-23 16:50:39 1187

原创大模型+强化学习_利用AI反馈扩展强化学习_RLAIF

探索使用 RLAIF (RL from AI Feedback (RLAIF) 方法替代 RLHF 方法，以提高大型语言模型与人类偏好的一致性。

2024-03-23 16:48:19 884

原创大模型+强化学习_精典方法_RLHF

为了解决强化学习系统在与真实世界环境交互时需要理解复杂目标的问题。

2024-03-23 16:46:59 998

原创如何选择：编写程序、调用大模型还是训练模型？

能用程序快速解决的问题就不调用模型，能调用模型解决的问题就不训练模型。

2024-03-17 15:01:23 487

原创论文阅读_时序模型_iTransformer

解决 Transformer 模型在预测具有大范围回溯窗口的时间序列时性能下降和计算爆炸的问题。

2024-03-17 14:59:10 1300

原创开源项目_代码生成模型评测工具

开源项目_代码生成模型评测工具

2024-03-17 14:56:51 1470

Android游戏中动画的实现

对于游戏等对界面要求较高的程序，一般需要控制View中的具体图像显示（如动画功能）下面介绍实现此功能常用的SurfaceView控制。

2012-03-06

Android程序中安装其它软件包

应用程序中有时需要调用其它软件，但有时用户没有安装需要调用的软件，为方便用户使用，以下例程实现了半自动化的引导用户安装。

2012-03-06

Android使用DOM方式解析XML

使用Android自带的工具，解析xml文件内容，并显示在程序界面上

2012-03-06

android文件管理器源码

android系统并不自带文件管理器，但是很多情况下，我们有诸如从SD中打开文件的需要. 下面介绍在代码中实现资源管理器，只需要一百行左右的一个类即可以最常用的文件选择功能。本代码为简单的文件管理器的实现,可独立编译执行.

2011-07-06

android将lib库打包成apk安装

将c程序编成动态链接库,在java界面中通过JNI调用它,并能打包成一个apk安装.以下为能在Android源码树中编译的全部例程源码和脚本

2010-11-18

Android使用XML-RPC实现blog客户端源码

能在Android系统中运行的, 使用XML-RPC实现csdn blog客户端(其它blog客户端可以通过修改源码实现),可以独立编译成功的源代码

2010-10-29

MSN博客搬家工具的可执行程序和源码

利用XML-RPC实现的MSN博客搬家工具的可执行程序及JAVA源码下载.代码及使用说明详见http://blog.csdn.net/xieyan0811 (注意：本程序只测试过迁移到CSDN，迁移到其它Blog可能需要修改代码)

2010-10-21

android对文件的MD5验证

能够独立编译运行的android的MD5验证程序

2010-08-31

android访问网络例程

可以独立编译的android访问网络的源码

2010-08-27

android人脸识别

利用android自带的识别库实现人脸识别的小例程,可以在源码中独立编译

2010-08-11

android JNI例程

简单的可以在源码环境中编译的完整android JNI例程

2010-08-10

android多媒体例程

可独立编译的android多媒体例程(可播放本地媒体文件和远程媒体文件)

2010-08-06

android语音合成例程

可以独立编译的android语音合成例程(中/英文)

2010-08-06

android gps例程

完整的android gps例程,可以在源码中编译通过并安装, 可以获得经度纬度及当前捕获的卫星个数

2010-08-05

三个android语音识别例程

三个android识别例程:调用其它程序识别(intent),调用后台服务识别(service),自己识别

2010-08-02

G1(android)刷机文档及工具

android g1刷机文档介绍了预备知识,备份原始系统,update.zip刷机和fastboot刷机方式

2010-05-06

学习java编程(二)

由于之前都用C/C++写程序，现在改用JAVA写android程序，有些相关的认识和积累，记录下来，自已保存资料，也供大家参考，帮助您在和我遇到同样问题的时候，可以快速解决

2009-10-13

学习java编程(一)

2009-10-13

Linux例程之二_Debug_显示当前函数调用关系

程序异常退出时，显示当时的函数调用关系显示当前函数正在被哪个函数调用

2009-04-11

linux例程之一_Debug_规范化打印信息

规范化程序打印信息打印当前运行程序所对应的源码位置统计程序运行时间

2009-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人