m0_63714693-CSDN博客

原创详读西瓜书+南瓜书第3章——线性回归

在这里，我们来深入探讨的相关内容，这章涵盖了从基础线性回归到更复杂的分类任务模型。我们会逐步分析其数学公式和实际应用场景。

2024-09-21 01:49:35 449

原创茴香豆：企业级知识问答工具实践闯关任务

在 InternStudio 中利用 Internlm2-7b 搭建标准版茴香豆知识助手，并使用 Gradio 界面完成 2 轮问答（问题不可与教程重复，作业截图需包括 gradio 界面问题和茴香豆回答）。知识库可根据根据自己工作、学习或感兴趣的内容调整，如金融、医疗、法律、音乐、动漫等（优秀学员必做）。

2024-09-20 03:06:10 875

原创 MindSearch CPU-only 版部署

按照教程，将 MindSearch 部署到 HuggingFace 并美化 Gradio 的界面，并提供截图和 Hugging Face 的Space的链接。

2024-09-20 02:53:38 750

原创 InternVL 微调实践闯关任务

follow 教学文档和视频使用QLoRA进行微调模型，复现微调效果，并能成功讲出梗图.尝试使用LoRA，或调整xtuner的config，如LoRA rank，学习率。看模型Loss会如何变化，并记录调整后效果(选做，使用LoRA或调整config可以二选一)

2024-09-20 02:37:16 645

原创 LMDeploy 量化部署进阶实践

使用结合W4A16量化与kv cache量化的模型封装本地API并与大模型进行一次对话，作业截图需包括显存占用情况与大模型回复，参考4.1 API开发(优秀学员必做)，使用Function call功能让大模型完成一次简单的"加"与"乘"函数调用，作业截图需包括大模型回复的工具调用情况，参考4.2 Function call(选做)

2024-09-20 02:20:35 643

在本节中，我们将带大家基于 Lagent 自定义自己的智能体。Lagent 中关于工具部分的介绍文档位于。继承BaseAction类实现简单工具的run方法；或者实现工具包内每个子工具的功能简单工具的run方法可选被tool_api装饰；工具包内每个子工具的功能都需要被tool_api装饰下面我们将实现一个调用 MagicMaker API 以完成文生图的功能。然后，我们将下面的代码复制进入'dongman', # 动漫'guofeng', # 国风'xieshi', # 写实。

2024-09-20 01:17:59 594

原创探索 InternLM 模型能力边界-进阶

这里将 "another's" 用作定语，表示 "属于另一个人的"，而 "person" 则是名词，表示 "人"。在这个句子中，我们需要表达的是 "属于另一个人的计算机系统"，因此应该使用 "another's" 而不是 "another person's"。翻译中的错误在于使用了 "another person's" 而不是 "another's person"。在提供的英文翻译中，缺少了一个动词来完整表达“未经授权访问”这个动作。你能解释为什么太阳系中的行星没有因为太阳的引力而掉入太阳内部吗？

2024-09-19 17:07:09 790

原创 OpenCompass 评测 InternLM-1.8B 实践

使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能，记录复现过程并截图。

2024-09-19 03:52:40 729

原创 XTuner 微调个人小助手认知任务

下面我们将根据项目的需求一步步的进行修改和调整吧！在 PART 1 的部分，由于我们不再需要在 HuggingFace 上自动下载模型，因此我们先要更换模型的路径以及数据集的路径为我们本地的路径。为了训练过程中能够实时观察到模型的变化情况，XTuner 贴心的推出了一个。

2024-09-19 02:58:41 909

原创 Llamaindex RAG实践

正常情况下，其会自动从互联网上下载，但可能由于网络原因会导致下载中断，此处我们可以从国内仓库镜像地址下载相关资源，保存到服务器上。:（我们也可以选用别的开源词向量模型来进行 Embedding，目前选用这个模型是相对轻量、支持中文且效果较好的，同学们可以自由尝试别的开源词向量模型）运行以下指令，新建一个python文件。我们在使用开源词向量模型构建开源词向量的时候，需要用到第三方库。即可进入以下网页，然后就可以开始尝试问问题了。进入开发机后，创建新的conda环境，命名为。复制完成后，在本地查看环境。

2024-09-19 01:10:17 735

原创书生浦语大模型 L1 浦语提示词工程

近期相关研究发现，LLM在对比浮点数字时表现不佳，经验证，internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题，例如认为13.8<13.11。：利用LangGPT优化提示词，使LLM输出正确结果。

2024-09-18 23:10:24 797

原创《南瓜书》第一章：绪论笔记

南瓜书》第一章的绪论部分提供了计算机科学的背景，定义了关键术语，并介绍了假设空间和归纳偏好的概念。这些内容为理解计算机系统和机器学习算法奠定了基础。掌握这些基础知识对于深入学习计算机科学和应用机器学习算法至关重要。

2024-09-18 20:35:40 933

原创 8G 显存玩转书生大模型 Demo

LMDeploy 已经支持了 InternLM-XComposer2 系列的部署，但值得注意的是 LMDeploy 仅支持了 InternLM-XComposer2 系列模型的视觉对话功能。LMDeploy 也已经支持了 InternVL2 系列模型的部署，让我们一起来使用 LMDeploy 部署 InternVL2-2B 模型。在使用 Upload Image 上传图片后，我们输入 Instruction 后按下回车，便可以看到模型的输出。首先，我们创建一个目录，用于存放我们的代码。

2024-09-17 18:08:32 765

原创算法leecode笔记

这段代码巧妙地利用哈希表提高了查找效率，能在 O(n) 时间内解决两数之和的问题。算法的核心思想是在遍历数组时，实时查找是否存在可以与当前元素配对的另一个元素，从而达到快速求解的目的。具体代码public:i < n;j < n;这段代码实现了用埃拉托色尼筛法来统计小于n的质数的个数。我们从算法的角度对其进行分析。这段代码利用埃拉托色尼筛法高效地筛选出小于n的所有质数，并统计它们的个数。

2024-09-17 17:10:12 1220

原创【书生大模型实战】L1-书生大模型全链路开源体系

书生大模型全链路开源开放体系是一套完整的开源生态系统，旨在为大规模自然语言处理（NLP）模型的训练、优化、推理和部署提供端到端的解决方案。该体系涵盖从数据准备到模型训练再到最终部署的所有环节，通过开源的方式降低大模型应用的门槛，帮助开发者、研究人员和企业快速构建、优化和应用深度学习模型。书生大模型全链路开源体系是一个完整、高效的开源解决方案，覆盖了从数据处理到模型部署的所有关键环节。该体系不仅极大简化了大模型的研发和应用过程，还通过开源和社区合作为AI技术的普及和创新提供了强大动力。

2024-09-15 22:50:19 860

原创【书生实战营】Git 课程

要求命名格式为 camp3_<id>.md，其中 <id> 是您的报名问卷ID。文件路径应为 ./data/Git/task/。【大家可以叫我】内容可以是 GitHub 昵称、微信昵称或其他网名。在 GitHub 上创建一个 Pull Request，提供对应的 PR 链接。二、使用本地Vscode连接InternStudio开发机使用VScode进行SSH远程连接连接好后，左下角如下：三、确保Tutorial文件夹是在demo文件夹下的1.ctrl+~进入终端进行操作。

2024-09-14 22:48:37 742

原创书生大模型入门岛(Python 关卡)

选择debug config时选择remote attach就行，随后会让我们选择debug server的地址，因为我们是在本地debug，所以全都保持默认直接回车就可以了，也就是我们的server地址为localhost:5678。开发机的链接命令可以在开发机控制台对应开发机"SSH连接"找到，复制登录命令到vscode的弹窗中然后回车，vscode就会开始链接InternStudio的服务器，记得此时切回去复制一下ssh的密码，待会会用到。首先，在代码编辑窗口中，代码的关键行上设置断点，以便于调试。

2024-09-14 03:01:12 800

原创【书生大模型实战】L0-Linux

InternStudio 是大模型时代下的云端算力平台。基于 InternLM 组织下的诸多算法库支持，为开发者提供开箱即用的大语言模型微调环境、工具、数据集，并完美兼容 🤗 HugginFace 开源生态。首先打开上面的链接进入InternStudio，完成登录会自动跳转到控制台界面，如下图所示：让我们来看一下如何创建开发机，我们来到首页，点击“创建开发机这里我们选择创建个人开发机，名称为testCuda版本为12.2，资源配置选择10%，时长默认就行。创建完成以后在开发机。

2024-09-13 22:37:12 738

原创自注意力机制与批量归一化在深度学习中的应用（Datawhale X 李宏毅苹果书 AI夏令营）

自注意力机制（Self-Attention Mechanism）允许模型在处理输入序列时关注序列中的不同位置，从而捕捉到长距离的依赖关系。其核心思想是计算序列中每个位置的表示与其他位置的关系，进而调整表示以包含全局信息。批量归一化（Batch Normalization, BN）是一种对网络中的每一层进行归一化的技术，其目的是加快训练速度、提高模型的稳定性。BN 通过规范化每一层的输入，使其均值为 0，方差为 1，来减少内部协方差偏移（Internal Covariate Shift）。

2024-09-02 00:23:39 692

原创机器学习-分类&损失函数（Datawhale X 李宏毅苹果书 AI夏令营）

在机器学习和数据科学中，优化问题是一个非常核心的主题。无论是训练机器学习模型，还是进行参数调优，都会涉及到优化问题。优化问题的目标是通过调整某些参数，使得目标函数（如损失函数或成本函数）达到最小值（或最大值）。常见的优化算法包括梯度下降、随机梯度下降、牛顿法等。优化问题可以形式化为如下表达式：其中，θ 是需要优化的参数，f(θ) 是目标函数。在机器学习中，f(θ)通常是损失函数，比如均方误差（MSE）、交叉熵损失等。为了找到最优解，我们通常使用迭代优化算法，如梯度下降。

2024-09-01 22:57:01 1296

原创深度学习进阶版test2__（Datawhale X 李宏毅苹果书 AI夏令营）

优化器决定了模型参数更新的方式。不同的优化器有不同的特点，适用于不同的数据分布和任务。常用的优化器包括SGD（随机梯度下降）、RMSprop、Adam等。选择合适的优化器对于模型训练的效率和效果至关重要。从最基础的梯度下降法，我们逐步演化出更加复杂的优化器。例如 Adam，它结合了动量 mtm_tmt 和均方根 σtσ_tσt 来调整参数更新步伐。通过这种方式，我们能够更有效地优化深度学习模型。

2024-08-30 22:02:09 1012

原创深度学习入门训练营test2--（Datawhale X 李宏毅苹果书 AI夏令营）

在模型训练的第一步，我们需要定义一个函数 fθ(x)，其中θ代表模型中的所有未知参数。这个函数的目的是通过输入特征 x 来预测输出值 y。对于线性回归模型来说，函数通常表现为：fθ(x)=θ0+θ1X1+θ2X2+⋯+θnXn 这里 θ0是偏置项,θ1,θ2,…,θn 是模型的权重。为了评估模型的预测效果，我们需要定义一个损失函数L(θ),它用来衡量模型预测结果与实际值之间的差距。常见的损失函数是均方误差（MSE），其公式为：L(θ)=。

2024-08-30 20:18:48 604

原创使用 Embassy 创建异步主循环

loop {info!("tick");这里定义了一个名为run的异步任务，该任务通过宏标记。这个宏告诉 Embassy 将该函数作为任务运行。任务的核心是一个无限循环，循环内每秒钟记录一次tick消息。用于在每次循环之间等待 1 秒钟，这是通过 Embassy 的异步时间模块实现的。本文介绍了如何使用 Embassy 在嵌入式系统中创建一个简单的异步主循环。通过这个例子，我们了解了异步任务的基本概念、任务生成器的使用以及如何管理时间和日志记录。

2024-08-29 02:12:28 931

原创标题：Embassy-Boot：轻量级引导加载程序

通过其分区设计和固件验证功能，开发者可以确保设备在进行固件更新时的安全性和稳定性。这是你所需要的博客内容的完整版本，包括了代码示例和详细说明。的设计原理、硬件支持及其应用场景，并结合实践经验展示如何使用该工具确保嵌入式设备的固件安全和高效更新。是一个轻量级、可靠的引导加载程序，支持断电保护的固件升级以及固件回滚功能。提供的一个方便工具，用于将固件写入 DFU 分区，并在设备重启时触发分区交换。嵌入式系统开发过程中，引导加载程序是至关重要的一环，负责管理固件的加载与更新。，为你的嵌入式项目提供坚实的基础。

2024-08-29 02:09:50 639

m0_63714693的博客