自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 西湖大学赵世钰老师【强化学习的数学原理】学习笔记2节

强化学习的数学原理是由西湖大学赵世钰老师带来的关于RL理论方面的详细课程,本课程深入浅出地介绍了RL的基础原理,前置技能只需要基础的编程能力、概率论以及一部分的高等数学,你听完之后会在大脑里面清晰的勾勒出RL公式推导链条中的每一个部分。赵老师明确知道RL创新研究的理论门槛在哪,也知道视频前的你我距离这个门槛还有多远。本笔记将会用于记录我学习中的理解,会结合赵老师的视频截图,以及PDF文档进行笔记注释,之后也会补充课程相关的代码样例,帮助大家理解Q:return和state-value的关系是什么?

2024-04-27 22:20:00 865

原创 西湖大学赵世钰老师【强化学习的数学原理】学习笔记1节

强化学习的数学原理是由西湖大学赵世钰老师带来的关于RL理论方面的详细课程,本课程深入浅出地介绍了RL的基础原理,前置技能只需要基础的编程能力、概率论以及一部分的高等数学,你听完之后会在大脑里面清晰的勾勒出RL公式推导链条中的每一个部分。赵老师明确知道RL创新研究的理论门槛在哪,也知道视频前的你我距离这个门槛还有多远。本笔记将会用于记录我学习中的理解,会结合赵老师的视频截图,以及PDF文档进行笔记注释,之后也会补充课程相关的代码样例,帮助大家理解。

2024-04-27 22:16:30 915

原创 西湖大学赵世钰老师【强化学习的数学原理】学习笔记-1、0节

Reinforcement learning:An introduction.强化学习界的圣经(广泛引用,但是数学内容不多,对深入学习不算友好,同时会有高级知识提前出现在基础内容中,导致学习不太友好)一大类书籍都偏向于通过文字描述,通过直观解释来介绍,另一大类又太过数学化,需要极强的专业背景,中间存在一个Gap等待被填充我们希望从本质去回答去回答算法设计的逻辑,将数学控制在合理的水平,既能清晰展现原理,又不会过于晦涩建议大家循序渐进,按照章节进行学习。

2024-04-27 22:11:57 954

原创 【InternLM 实战营第二期-笔记7】OpenCompass 大模型评测实战(含报错解答)

上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0),用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现:提供公平、公开、可复现的大模型评测方案全面的能力维度:五大维度设计,提供 70+ 个数据集约 40 万题的的模型评测方案,全面评估模型能力丰富的模型支持:已支持 20+ HuggingFace 及 API 模型分布式高效评测:一行命令实现任务分割和分布式评测,数小时即可完成千亿模型全量评测。

2024-04-21 16:59:48 836

原创 【InternLM 实战营第二期-笔记6】Lagent & AgentLego 智能体应用搭建

在本节中,我们将基于 AgentLego 构建自己的自定义工具。AgentLego 在这方面提供了较为详尽的文档,文档地址为。继承 BaseTool 类修改 default_desc 属性(工具功能描述)如有需要,重载 setup 方法(重型模块延迟加载)重载 apply 方法(工具功能实现)其中第一二四步是必须的步骤。下面我们将实现一个调用 MagicMaker 的 API 以实现图像生成的工具。MagicMaker 是汇聚了优秀 AI 算法成果的免费 AI 视觉素材生成与创作平台。

2024-04-21 16:59:04 1105

原创 LangChain学习笔记与样程

用于封装langchain尚未支持的大型语言模型也可以用来模拟测试你来定义当该iim模块被调用的时候,如何根据输入的文本来输出概念上,链是在规定的标准下,不同模块的组合。链是一个抽象出来的概念/标准,并不是一定要用链才能完成对llm的调用。链提高了模块的标准化,复用性。链增加了工程的复杂度,冗余度。

2024-04-15 22:30:39 950

原创 【InternLM 实战营第二期-笔记5】LMDeploy 量化部署 LLM&VLM实战

书生·浦语是上海人工智能实验室和商汤科技联合研发的一款大模型,很高兴能参与本次第二期训练营,我也将会通过笔记博客的方式记录学习的过程与遇到的问题,并为代码添加注释,希望可以帮助到你们。

2024-04-12 13:18:48 829

原创 【InternLM 实战营第二期-笔记4】XTuner 微调个人小助手认知

在本节中主要就是带领着大家跑通了 XTuner 的一个完整流程,通过了解数据集和模型的使用方法、配置文件的制作和训练以及最后的转换及整合。那在后面假如我们也有想要微调出自己的一个模型,我们也可以尝试使用同样流程和方法进行进一步的实践!

2024-04-12 13:18:03 872

原创 【InternLM 实战营第二期-笔记3】茴香豆:搭建你的 RAG 智能助理

大模型的训练时间在前,无法解答针对新增知识的问题,如何解决大模型的幻觉?传统方法:采集新增语料,通过微调等方式对模型进行再训练。缺陷:知识新增太快,语料太多,语料难以收集,训练成本太大。rag技术的提出。(不需要训练,解决新增知识的问题)Rag(retrieval augmented generation)是一种结合了检索(retrieval)和生成(generation)的技术,旨在通过利用外部知识库来增强大型语言模型(llms)的性能。

2024-04-12 13:16:11 1006

原创 【InternLM 实战营第二期-笔记2】轻松玩转书生·浦语大模型趣味 Demo

Lagent 是一个轻量级、开源的基于大语言模型的智能体(agent)框架,支持用户快速地将一个大语言模型转变为多种类型的智能体,并提供了一些典型工具为大语言模型赋能。它的整个框架图如下:Lagent 的特性总结如下:流式输出:提供 stream_chat 接口作流式输出,本地就能演示酷炫的流式 Demo。

2024-04-12 13:11:47 910

原创 【InternLM 实战营第二期-笔记1】书生浦语大模型开源体系详细介绍&InternLM2技术报告解读(附相关论文)

书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili自从ChatGPT和GPT-4的出现以来 (OpenAI, 2023),大型语言模型(LLMs)在学术界和工业界迅速走红。训练在数十亿令牌上的模型展现了深刻的情感理解和问题解决能力,引发了人们普遍认为AGI时代即将到来的猜测。尽管如此,开发出与ChatGPT或GPT-4相当能力的模型的道路仍然模糊不清。开源社区正在努力缩小专有LLM与开源模型之间的差距。在过去的一年里,如LLaMA (Touvron et al., 2023a;

2024-04-12 13:09:37 1491

原创 【c++】 期末测试1-2

期末测试1-2

2022-12-02 21:22:01 925 1

原创 [c++] 实验八 类+继承+流输入输出+有序插入链表

高级语言程序设计(实验八),实验1-4题

2022-11-24 20:18:33 974 1

原创 [c++] 实验七 类(静态+友元+运算符重载+继承与派生)

高级语言程序设计(实验七),实验1-5题

2022-11-16 17:21:53 2071

原创 [c++] 实验六 类

高级语言程序设计(实验六),实验1-3题

2022-11-16 16:55:04 752

原创 [C++] 第十二章作业 虚函数与多态类

高级语言程序设计(第十二章), 第1题

2022-11-15 20:46:49 639

原创 [C++] 第十一章作业 继承与派生

高级语言程序设计(第十一章), 第1题

2022-11-15 20:14:28 487

原创 [C++] 第九章作业 类Ⅱ

高级语言程序设计(第九章), 第1-2题

2022-11-12 00:26:22 557

原创 [c++]实验五 指针(二维指针空间的开辟与释放)

高级语言程序设计(实验五),实验1-5题

2022-11-09 15:26:39 924

原创 [C++] 第八章作业 类Ⅰ

高级语言程序设计(第八章), 第1-2题

2022-11-08 12:44:01 675 1

原创 [C++] 第七章作业 自定义数据结构(结构体)

高级语言程序设计(第七章), 第1-2题

2022-11-07 23:53:12 854 3

原创 [C++] 第六章作业 指针和引用(字符串处理)

高级语言程序设计(第六章), 第1-3题

2022-10-29 13:59:06 959 3

原创 [C++] 实验四 数组 (简化约瑟夫问题的三种写法)

高级语言程序设计(实验四),实验1-5题

2022-10-26 14:52:32 1147 4

原创 [C++] 第五章作业 数组(接收存储+简单处理)

高级语言程序设计(第五章), 第1-3题

2022-10-22 19:19:56 898 2

原创 [C++] 第四章作业 函数

高级语言程序设计(第四章), 第1-3题

2022-10-15 18:48:17 912 2

原创 [C++] 实验三 函数+小析递归

高级语言程序设计(实验三),实验1-7题

2022-10-13 20:52:07 846

原创 [C++] 第三章作业 程序控制(选择+循环)

高级语言程序设计(第三章), 第1-4题

2022-10-07 15:52:35 1099 2

原创 [C++] 实验二 程序控制(选择+循环)

高级语言程序设计(实验二),实验1-5题

2022-10-05 14:23:01 788 1

原创 [C++] 第二章作业 基本数据类型与运算符

高级语言程序设计(第二章), 第1-2题

2022-09-28 21:41:20 696

原创 [C++] 实验一 基本数据类型与运算符

高级语言程序设计(实验一),实验1-5题

2022-09-28 16:02:40 932

原创 Flutter环境安装与问题解决

Flutter环境安装与问题解决

2022-09-21 08:27:21 3217

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除