- 博客(30)
- 收藏
- 关注
原创 详读西瓜书+南瓜书第3章——线性回归
在这里,我们来深入探讨的相关内容,这章涵盖了从基础线性回归到更复杂的分类任务模型。我们会逐步分析其数学公式和实际应用场景。
2024-09-21 01:49:35 449
原创 茴香豆:企业级知识问答工具实践闯关任务
在 InternStudio 中利用 Internlm2-7b 搭建标准版茴香豆知识助手,并使用 Gradio 界面完成 2 轮问答(问题不可与教程重复,作业截图需包括 gradio 界面问题和茴香豆回答)。知识库可根据根据自己工作、学习或感兴趣的内容调整,如金融、医疗、法律、音乐、动漫等(优秀学员必做)。
2024-09-20 03:06:10 875
原创 MindSearch CPU-only 版部署
按照教程,将 MindSearch 部署到 HuggingFace 并美化 Gradio 的界面,并提供截图和 Hugging Face 的Space的链接。
2024-09-20 02:53:38 750
原创 InternVL 微调实践闯关任务
follow 教学文档和视频使用QLoRA进行微调模型,复现微调效果,并能成功讲出梗图.尝试使用LoRA,或调整xtuner的config,如LoRA rank,学习率。看模型Loss会如何变化,并记录调整后效果(选做,使用LoRA或调整config可以二选一)
2024-09-20 02:37:16 645
原创 LMDeploy 量化部署进阶实践
使用结合W4A16量化与kv cache量化的模型封装本地API并与大模型进行一次对话,作业截图需包括显存占用情况与大模型回复,参考4.1 API开发(优秀学员必做),使用Function call功能让大模型完成一次简单的"加"与"乘"函数调用,作业截图需包括大模型回复的工具调用情况,参考4.2 Function call(选做)
2024-09-20 02:20:35 643
原创 Lagent 自定义你的 Agent 智能体
在本节中,我们将带大家基于 Lagent 自定义自己的智能体。Lagent 中关于工具部分的介绍文档位于。继承BaseAction类实现简单工具的run方法;或者实现工具包内每个子工具的功能简单工具的run方法可选被tool_api装饰;工具包内每个子工具的功能都需要被tool_api装饰下面我们将实现一个调用 MagicMaker API 以完成文生图的功能。然后,我们将下面的代码复制进入'dongman', # 动漫'guofeng', # 国风'xieshi', # 写实。
2024-09-20 01:17:59 594
原创 探索 InternLM 模型能力边界-进阶
这里将 "another's" 用作定语,表示 "属于另一个人的",而 "person" 则是名词,表示 "人"。在这个句子中,我们需要表达的是 "属于另一个人的计算机系统",因此应该使用 "another's" 而不是 "another person's"。翻译中的错误在于使用了 "another person's" 而不是 "another's person"。在提供的英文翻译中,缺少了一个动词来完整表达“未经授权访问”这个动作。你能解释为什么太阳系中的行星没有因为太阳的引力而掉入太阳内部吗?
2024-09-19 17:07:09 790
原创 OpenCompass 评测 InternLM-1.8B 实践
使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程并截图。
2024-09-19 03:52:40 729
原创 XTuner 微调个人小助手认知任务
下面我们将根据项目的需求一步步的进行修改和调整吧!在 PART 1 的部分,由于我们不再需要在 HuggingFace 上自动下载模型,因此我们先要更换模型的路径以及数据集的路径为我们本地的路径。为了训练过程中能够实时观察到模型的变化情况,XTuner 贴心的推出了一个。
2024-09-19 02:58:41 909
原创 Llamaindex RAG实践
正常情况下,其会自动从互联网上下载,但可能由于网络原因会导致下载中断,此处我们可以从国内仓库镜像地址下载相关资源,保存到服务器上。:(我们也可以选用别的开源词向量模型来进行 Embedding,目前选用这个模型是相对轻量、支持中文且效果较好的,同学们可以自由尝试别的开源词向量模型) 运行以下指令,新建一个python文件。我们在使用开源词向量模型构建开源词向量的时候,需要用到第三方库。即可进入以下网页,然后就可以开始尝试问问题了。进入开发机后,创建新的conda环境,命名为。复制完成后,在本地查看环境。
2024-09-19 01:10:17 735
原创 书生浦语大模型 L1 浦语提示词工程
近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为13.8<13.11。:利用LangGPT优化提示词,使LLM输出正确结果。
2024-09-18 23:10:24 797
原创 《南瓜书》第一章:绪论笔记
南瓜书》第一章的绪论部分提供了计算机科学的背景,定义了关键术语,并介绍了假设空间和归纳偏好的概念。这些内容为理解计算机系统和机器学习算法奠定了基础。掌握这些基础知识对于深入学习计算机科学和应用机器学习算法至关重要。
2024-09-18 20:35:40 933
原创 8G 显存玩转书生大模型 Demo
LMDeploy 已经支持了 InternLM-XComposer2 系列的部署,但值得注意的是 LMDeploy 仅支持了 InternLM-XComposer2 系列模型的视觉对话功能。LMDeploy 也已经支持了 InternVL2 系列模型的部署,让我们一起来使用 LMDeploy 部署 InternVL2-2B 模型。在使用 Upload Image 上传图片后,我们输入 Instruction 后按下回车,便可以看到模型的输出。首先,我们创建一个目录,用于存放我们的代码。
2024-09-17 18:08:32 765
原创 算法leecode笔记
这段代码巧妙地利用哈希表提高了查找效率,能在 O(n) 时间内解决两数之和的问题。算法的核心思想是在遍历数组时,实时查找是否存在可以与当前元素配对的另一个元素,从而达到快速求解的目的。具体代码public:i < n;j < n;这段代码实现了用埃拉托色尼筛法来统计小于n的质数的个数。我们从算法的角度对其进行分析。这段代码利用埃拉托色尼筛法高效地筛选出小于n的所有质数,并统计它们的个数。
2024-09-17 17:10:12 1220
原创 【书生大模型实战】L1-书生大模型全链路开源体系
书生大模型全链路开源开放体系是一套完整的开源生态系统,旨在为大规模自然语言处理(NLP)模型的训练、优化、推理和部署提供端到端的解决方案。该体系涵盖从数据准备到模型训练再到最终部署的所有环节,通过开源的方式降低大模型应用的门槛,帮助开发者、研究人员和企业快速构建、优化和应用深度学习模型。书生大模型全链路开源体系是一个完整、高效的开源解决方案,覆盖了从数据处理到模型部署的所有关键环节。该体系不仅极大简化了大模型的研发和应用过程,还通过开源和社区合作为AI技术的普及和创新提供了强大动力。
2024-09-15 22:50:19 860
原创 【书生实战营】Git 课程
要求命名格式为 camp3_<id>.md,其中 <id> 是您的报名问卷ID。文件路径应为 ./data/Git/task/。【大家可以叫我】内容可以是 GitHub 昵称、微信昵称或其他网名。在 GitHub 上创建一个 Pull Request,提供对应的 PR 链接。二、使用本地Vscode连接InternStudio开发机使用VScode进行SSH远程连接连接好后,左下角如下:三、确保Tutorial文件夹是在demo文件夹下的1.ctrl+~进入终端进行操作。
2024-09-14 22:48:37 742
原创 书生大模型入门岛(Python 关卡)
选择debug config时选择remote attach就行,随后会让我们选择debug server的地址,因为我们是在本地debug,所以全都保持默认直接回车就可以了,也就是我们的server地址为localhost:5678。开发机的链接命令可以在开发机控制台对应开发机"SSH连接"找到,复制登录命令到vscode的弹窗中然后回车,vscode就会开始链接InternStudio的服务器,记得此时切回去复制一下ssh的密码,待会会用到。首先,在代码编辑窗口中,代码的关键行上设置断点,以便于调试。
2024-09-14 03:01:12 800
原创 【书生大模型实战】L0-Linux
InternStudio 是大模型时代下的云端算力平台。基于 InternLM 组织下的诸多算法库支持,为开发者提供开箱即用的大语言模型微调环境、工具、数据集,并完美兼容 🤗 HugginFace 开源生态。首先打开上面的链接进入InternStudio,完成登录会自动跳转到控制台界面,如下图所示:让我们来看一下如何创建开发机,我们来到首页,点击“创建开发机这里我们选择创建个人开发机,名称为testCuda版本为12.2,资源配置选择10%,时长默认就行。创建完成以后在开发机。
2024-09-13 22:37:12 738
原创 自注意力机制与批量归一化在深度学习中的应用(Datawhale X 李宏毅苹果书 AI夏令营)
自注意力机制(Self-Attention Mechanism)允许模型在处理输入序列时关注序列中的不同位置,从而捕捉到长距离的依赖关系。其核心思想是计算序列中每个位置的表示与其他位置的关系,进而调整表示以包含全局信息。批量归一化(Batch Normalization, BN)是一种对网络中的每一层进行归一化的技术,其目的是加快训练速度、提高模型的稳定性。BN 通过规范化每一层的输入,使其均值为 0,方差为 1,来减少内部协方差偏移(Internal Covariate Shift)。
2024-09-02 00:23:39 692
原创 机器学习-分类&损失函数(Datawhale X 李宏毅苹果书 AI夏令营)
在机器学习和数据科学中,优化问题是一个非常核心的主题。无论是训练机器学习模型,还是进行参数调优,都会涉及到优化问题。优化问题的目标是通过调整某些参数,使得目标函数(如损失函数或成本函数)达到最小值(或最大值)。常见的优化算法包括梯度下降、随机梯度下降、牛顿法等。优化问题可以形式化为如下表达式:其中,θ 是需要优化的参数,f(θ) 是目标函数。在机器学习中,f(θ)通常是损失函数,比如均方误差(MSE)、交叉熵损失等。为了找到最优解,我们通常使用迭代优化算法,如梯度下降。
2024-09-01 22:57:01 1296
原创 深度学习进阶版test2__(Datawhale X 李宏毅苹果书 AI夏令营)
优化器决定了模型参数更新的方式。不同的优化器有不同的特点,适用于不同的数据分布和任务。常用的优化器包括SGD(随机梯度下降)、RMSprop、Adam等。选择合适的优化器对于模型训练的效率和效果至关重要。从最基础的梯度下降法,我们逐步演化出更加复杂的优化器。例如 Adam,它结合了动量 mtm_tmt 和均方根 σtσ_tσt 来调整参数更新步伐。通过这种方式,我们能够更有效地优化深度学习模型。
2024-08-30 22:02:09 1012
原创 深度学习入门训练营test2--(Datawhale X 李宏毅苹果书 AI夏令营)
在模型训练的第一步,我们需要定义一个函数 fθ(x),其中θ代表模型中的所有未知参数。这个函数的目的是通过输入特征 x 来预测输出值 y。对于线性回归模型来说,函数通常表现为:fθ(x)=θ0+θ1X1+θ2X2+⋯+θnXn 这里 θ0是偏置项,θ1,θ2,…,θn 是模型的权重。为了评估模型的预测效果,我们需要定义一个损失函数L(θ),它用来衡量模型预测结果与实际值之间的差距。常见的损失函数是均方误差(MSE),其公式为:L(θ)=。
2024-08-30 20:18:48 604
原创 使用 Embassy 创建异步主循环
loop {info!("tick");这里定义了一个名为run的异步任务,该任务通过宏标记。这个宏告诉 Embassy 将该函数作为任务运行。任务的核心是一个无限循环,循环内每秒钟记录一次tick消息。用于在每次循环之间等待 1 秒钟,这是通过 Embassy 的异步时间模块实现的。本文介绍了如何使用 Embassy 在嵌入式系统中创建一个简单的异步主循环。通过这个例子,我们了解了异步任务的基本概念、任务生成器的使用以及如何管理时间和日志记录。
2024-08-29 02:12:28 931
原创 标题:Embassy-Boot:轻量级引导加载程序
通过其分区设计和固件验证功能,开发者可以确保设备在进行固件更新时的安全性和稳定性。这是你所需要的博客内容的完整版本,包括了代码示例和详细说明。的设计原理、硬件支持及其应用场景,并结合实践经验展示如何使用该工具确保嵌入式设备的固件安全和高效更新。是一个轻量级、可靠的引导加载程序,支持断电保护的固件升级以及固件回滚功能。提供的一个方便工具,用于将固件写入 DFU 分区,并在设备重启时触发分区交换。嵌入式系统开发过程中,引导加载程序是至关重要的一环,负责管理固件的加载与更新。,为你的嵌入式项目提供坚实的基础。
2024-08-29 02:09:50 639
原创 从裸机到异步Rust:深入了解Embassy执行器
Embassy执行器通过将异步编程模型引入嵌入式系统开发,为开发者提供了一种高效、灵活且易于维护的任务调度方式。它的无堆内存管理、高效的轮询机制、集成的定时器以及对中断的友好支持,使其在实际开发中表现出色。在未来的嵌入式开发中,随着系统复杂度的增加,Embassy执行器的这些优势将变得愈加重要。无论是实时任务调度、低功耗应用,还是多任务协同工作,Embassy执行器都能为我们提供强有力的支持。对于希望在嵌入式开发中充分利用Rust异步编程特性的开发者来说,Embassy无疑是一个不可错过的工具。
2024-08-29 01:56:25 918
原创 从裸机到异步Rust:在嵌入式系统中的应用之旅
随着Rust语言在嵌入式领域的普及,Embassy等框架提供了现代化的异步处理方式,使开发者能够以更高效、更优雅的方式编写嵌入式应用程序。从裸机编程到异步Rust的演变,展示了嵌入式系统开发的不同层次。对于复杂且需要高效资源管理的嵌入式系统,异步Rust无疑是一个强大的工具。Embassy框架提供了异步编程模型,使得我们可以在嵌入式系统中以极低的开销实现并发。为了简化开发流程并减少出错的机会,Embassy提供了硬件抽象层(HAL),使得我们可以通过更高级的API来访问硬件外设。
2024-08-29 01:49:18 645
原创 Embassy-cn 0.1.0 第一节读后感
异步是一种并发编程模型,他允许任务可以并发执行,当一个任务遇到I/O操作时,会将控制权交出,让其他任务继续执行,等到I/O操作完成时再继续执行。就比如你在煮面条的同时,可以去洗碗,这就是异步的一种体现。
2024-08-25 02:24:43 1055
原创 深度学习进阶版__test1(Datawhale X 李宏毅苹果书 AI夏令营)
在机器学习中,尤其是深度学习领域,我们经常会遇到和这两个概念。它们是优化算法在寻找最优解的过程中可能遇到的障碍。
2024-08-24 11:30:10 746
原创 深度学习入门训练营——test 1(Datawhale X 李宏毅苹果书 AI夏令营)
机器学习就是让机器通过学习大量数据,找到一个能最好地描述这些数据之间关系的函数。这个函数可以用来预测新的数据,或者完成特定的任务。分类问题是机器学习中的另一个重要任务,它的目标是将样本划分到预先定义好的类别中。与回归问题预测一个连续数值不同,分类问题预测的是一个离散的类别标签。分类问题的输出是有限个离散的类别,而不是连续的数值。我们希望将样本划分到不同的类别中,以便进行后续的处理或决策。分类问题的结果可以直接用于决策,比如将垃圾邮件过滤掉,或者对图像进行标注。结构化学习。
2024-08-24 11:04:03 943
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人