追风赶月。-CSDN博客

原创【3D分割】Segment Anything in 3D with Radiance Fields

NeRF（Neural Radiance Fields）是用于表示3D场景的连续函数，通过多层感知机（MLP）将空间坐标和视角方向映射到相应位置的颜色和体积密度。渲染图像时，NeRF通过光线投射技术生成每个像素点的颜色，公式如下：其中，权重表示在射线路径 r(t)上的透明度和体积密度的综合效果，公式如下：其中 tn 和 t 分别为光线的近界和远界。

2024-09-27 20:55:18 1086

原创【学术教程】如何通过GitHub联系项目源代码作者

在使用或导入GitHub上的开源项目时，我们有时会遇到代码问题无法解决，这时候联系项目的源代码作者是一种有效的解决方式。以下是一种简单的联系GitHub项目作者的方法。

2024-09-04 13:53:54 253

原创【问题解决】Windows微软拼音的中文状态打不出来顿号

不知道键盘乱按了什么地方，突然|\按键打不出顿号了，打出来的其他符号也都变成了英文状态。起初还以为是半角、全角的缘故。按住ctrl+句号，切换中英文符号。

2024-08-29 10:17:42 309

原创【大模型实战】基于大模型的中国历史智能助手项目分享：史小白

在当下的AI热潮中，我完成了一个基于大模型的项目——。可用于帮助用户探索和学习中国历史。项目基于通过整合现代人工智能技术，史小白致力于为历史爱好者提供一个便捷的学习平台。在我的B站视频【】中，我详细展示了项目架构、功能模块以及实际运行效果。希望通过这个视频，能够启发更多开发者利用AI技术做出有趣的项目。欢迎大家观看【大模型项目】史小白——中国历史智能助手。

2024-08-27 17:32:42 548

原创【书生大模型实战】L2-茴香豆：企业级知识问答工具实践闯关任务

茴香豆是由书生·浦语团队开发的一款开源、专门针对国内企业级使用场景设计并优化的知识问答工具。在基础 RAG 课程中我们了解到，RAG 可以有效的帮助提高 LLM 知识检索的相关性、实时性，同时避免 LLM 训练带来的巨大成本。在实际的生产和生活环境需求，对 RAG 系统的开发、部署和调优的挑战更大，如需要解决群应答、能够无关问题拒答、多渠道应答、更高的安全性挑战。因此，根据大量国内用户的实际需求，总结出了三阶段Pipeline的茴香豆知识问答助手架构，帮助企业级用户可以快速上手安装部署。茴香豆特点。

2024-08-27 12:55:06 721

原创【书生大模型实战】L2-MindSearch CPU-only 版部署

随着硅基流动提供了免费的 InternLM2.5-7B-Chat 服务（免费的 InternLM2.5-7B-Chat 真的很香），MindSearch 的部署与使用也就迎来了纯 CPU 版本，进一步降低了部署门槛。那就让我们来一起看看如何使用硅基流动的 API 来部署 MindSearch 吧。

2024-08-22 16:16:14 717

原创【实战营彩蛋】MindSearch 快速部署（InternStudio 版）

选择 InternStudio 算力平台 50% A100 的 cuda 12.2 的开发机，并使用ssh vscode 远程连接到开发机。MindSearch是基于LLM Web搜索引擎的多智能体框架（如 Perplexity.ai Pro和SearchGPT）比如，对于多步骤的复杂问题，模型能够分析用户需求，先搜索嫦娥 6 号的技术难点、再针对每一个技术难点搜索对应的解决方案，再从任务目标、技术手段、科学成果、国际合作 4 个方面对比阿波罗 11 号登月计划，最后总结我国探月成功的贡献。

2024-08-20 10:43:35 862

原创【书生大模型实战】InternVL 微调实践闯关任务

InternVL 是一种用于多模态任务的深度学习模型，旨在处理和理解多种类型的数据输入，如图像和文本。它结合了视觉和语言模型，能够执行复杂的跨模态任务，比如图文匹配、图像描述生成等。通过整合视觉特征和语言信息，InternVL 可以在多模态领域取得更好的表现。对于InternVL这个模型来说，它vision模块就是一个微调过的ViT，llm模块是一个InternLM的模型。对于视觉模块来说，它的特殊之处在Dynamic High Resolution。

2024-08-19 13:46:46 873

原创【书生大模型实战】L2-LMDeploy 量化部署实践闯关任务

注释：实验室提供的环境为虚拟化的显存，nvidia-smi是NVIDIA GPU驱动程序的一部分，用于显示NVIDIA GPU的当前状态，故当前环境只能看80GB单卡 A100 显存使用情况，无法观测虚拟化后30%或50%A100等的显存情况。模型在运行时，占用的显存可大致分为三部分：模型参数本身占用的显存、kv cache占用的显存，以及中间运算结果占用的显存。让我们回到LMDeploy，在最新的版本中，LMDeploy使用的是AWQ算法，能够实现模型的4bit权重量化。输入以下指令，执行量化工作。

2024-08-15 00:00:24 829

原创【书生大模型实战】L2-Lagent 自定义你的 Agent 智能体

Lagent 是一个轻量级开源智能体框架，旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。Arxiv 搜索Bing 地图Google 学术搜索Google 搜索交互式 IPython 解释器IPython 解释器PPTPython 解释器在本节中，我们将带大家基于 Lagent 自定义自己的智能体。Lagent 中关于工具部分的介绍文档位于动作 — Lagent。继承BaseAction类实现简单工具的run方法；

2024-08-13 21:00:23 916

原创【模型结构】LLaMA: Open and Efficient Foundation Language Models

这项工作的重点是训练一系列语言模型，通过训练比通常情况下更多的词块，在各种推理预算下实现最佳性能。由此产生的模型称为 LLaMA（7B-65B）。

2024-08-08 19:58:39 966

原创【大模型学习】多模态大模型进行偏好优化

训练模型以理解并预测人类偏好是一项复杂的任务。传统方法如SFT（监督微调）通常需要较高的成本，因为这些算法需要对数据进行特定标签的标注。偏好优化（Preference Optimization）作为一种替代方案，可以简化这一过程并提供更准确的结果。通过对候选回答的对比和排序，而不是赋予固定的标签，偏好优化能够更高效地捕捉人类偏好的细微差别。虽然偏好优化已经在大语言模型中广泛使用，但现在它也可以应用于视觉语言模型（VLM）。得益于。

2024-08-08 10:41:16 859

原创【大模型学习】快速下载大模型权重和评估大模型占用显存

首先，我们需要设置环境变量以使用镜像站点加速下载。这里repo_id可以直接在Hugging Face官网上复制得到：local_dir就是保存在自己本地的文件夹，force_download就是支持断点续传，避免中途因为网络断了，导致要重新下载。此外，我们可以通过和参数允许或者忽略某些文件以支持断点续传和正则匹配，因为大模型的权重一般是分成了好几个包，如果同时下载可能会导致网速变慢，所以我们可以设置这个参数，选择先下载一部分的包。

2024-08-07 14:27:45 710

原创【书生大模型实战】L1-OpenCompass 评测 InternLM-1.8B 实践

OpenCompass2.0，又称“司南”，是由上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系。其主要是用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现：提供公平、公开、可复现的大模型评测方案全面的能力维度：五大维度设计，提供 70+ 个数据集约 40 万题的的模型评测方案，全面评估模型能力丰富的模型支持：已支持 20+ HuggingFace 及 API 模型分布式高效评测：一行命令实现任务分割和分布式评测，数小时即可完成千亿模型全量评测。

2024-08-04 14:15:07 996

原创【书生大模型实战】L1-XTuner 微调个人小助手认知任务

当我们在测试完模型认为其满足我们的需求后，就可以对模型进行量化部署等操作了，这部分的内容在之后关于 LMDeploy 的课程中将会详细的进行讲解，敬请期待后续的课程吧！对于全量微调的模型（full）其实是不需要进行整合这一步的，因为全量微调修改的是原模型的权重而非微调一个新的 Adapter ，因此是不需要进行模型整合的。比如我们这里微调的是书生·浦语的模型，我们就可以匹配搜索。，在使用前我们需要准备好三个路径，包括原模型的路径、训练好的 Adapter 层的（模型格式转换后的）路径以及最终保存的路径。

2024-08-02 09:54:53 592

原创【书生大模型实战】L1-Llamaindex RAG实践

什么是RAGLLM会产生误导性的 “幻觉”，依赖的信息可能过时，处理特定知识时效率不高缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。正是在这样的背景下，检索增强生成技术（Retrieval-Augmented Generation，RAG）应时而生，成为 AI 时代的一大趋势。RAG 通过在语言模型生成答案之前，先从广泛的文档数据库中检索相关信息，然后利用这些信息来引导生成过程，极大地提升了内容的准确性和相关性。RAG 有效地缓解了幻觉问题，提高了知识更新的速度，并增强了内容生成的可追溯性。

2024-08-01 22:34:03 850

原创【书生大模型实战】L1-LangGPT结构化提示词编写实践

近期相关研究发现，LLM在对比浮点数字时表现不佳，经验证，internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题，例如认为13.8

2024-07-30 20:21:05 315

原创【书生大模型实战】L1-8G 显存玩转书生大模型 Demo

LMDeploy 已经支持了 InternLM-XComposer2 系列的部署，但值得注意的是 LMDeploy 仅支持了 InternLM-XComposer2 系列模型的视觉对话功能。LMDeploy 也已经支持了 InternVL2 系列模型的部署，让我们一起来使用 LMDeploy 部署 InternVL2-2B 模型。接下来，我们使用 LMDeploy 启动一个与 InternLM-XComposer2-VL-1.8B 模型交互的 Gradio 服务。首先，创建一个目录，用于存放代码。

2024-07-30 12:37:19 850

原创【书生大模型实战】L1-书生大模型全链路开源体系

大模型已经成为发展AGI的重要途径，传统的专用模型是针对特定任务，一个模型解决一个问题，比如ImageNet竞赛中涌现的分类模型，AlphaFold等等。而通用模型旨在利用一个模型完成All任务，对应多种模态。比如GPT4通过Prompt实现。

2024-07-30 00:30:23 374

原创【模型结构】LLaMA: Open and Efficient Foundation Language Models

这项工作的重点是训练一系列语言模型，通过训练比通常情况下更多的词块，在各种推理预算下实现最佳性能。由此产生的模型称为 LLaMA（7B-65B）。

2024-07-29 10:29:27 653

原创【大模型学习】利用最新版Langchain-Chatchat搭建个人知识库问答LLM

如果存在此选项，则使用它。修改配置文件，需要根据步骤2. 模型推理框架并加载模型中选用的模型推理框架与加载的模型进行模型接入配置，具体参考model_settings.yaml中的注释。默认知识库位于CHATCHAT_ROOT/data/knowledge_base，如果你想把知识库放在不同的位置，或者想连接现有的知识库，可以在这里修改对应目录即可。-i, --incremental：本地文件夹中存在文件的增量更新矢量存储，数据库中不存在。--trim-db：删除本地数据库中不存在的文档文件夹中的文档。

2024-07-19 15:59:28 1266 7

原创【书生大模型实战】L0-Git 基础知识

每位参与者提交一份自我介

2024-07-16 10:13:50 310

原创【书生大模型实战】L0-Python

【书生大模型实战】L0-Python。

2024-07-16 09:24:19 278

原创【书生大模型实战】L0-Linux

【书生大模型实战】L0-Linux

2024-07-15 18:11:00 709

原创【开放词汇分割】Side Adapter Network for Open-Vocabulary Semantic Segmentation

Side Adapter Network (SAN) 是一个端到端的框架，旨在充分利用CLIP模型在开放词汇语义分割中的能力。SAN由一个轻量级的视觉Transformer实现，可以利用CLIP的特征，并且有两个输出：掩码提案和用于掩码识别的注意力偏差。这些注意力偏差应用于CLIP的自注意力机制，以识别掩码提案的类别。在实践中，将浅层 CLIP 层的特征融合到 SAN 中，并将注意力偏差应用于更深的 CLIP 层以进行识别。通过这种单前向设计，可以最大限度地降低 CLIP 模型的成本。SAN的详细架构。

2024-07-01 17:05:59 748

空空如也

空空如也