算法少帅-CSDN博客

原创书生浦语大模型教程2-6：OpenCompass 评测书生大模型实践

OpenCompass是一个大模型评测框架,该框架有大量的大模型测评工具以及数据集合等为大模型性能提供了一个较好的量化标准。

2024-12-10 16:27:32 167

原创书生浦语大模型教程2-5：XTuner 微调个人小助手认知

微调并不是将全员参数进行训练，一般通过外置一个网络对原网络进行微调，LoRA与QLoRA流程如下图所示。

2024-12-10 16:23:13 315

原创书生浦语大模型教程2-4：LlamaIndex+InternLM RAG 实践

RAG 能够让基础模型实现非参数知识更新，无需训练就可以掌握新领域的知识。它允许您构建应用程序，既利用 LLMs 的优势，又融入您的私有或领域特定信息。LlamaIndex框架可以方便的构建RAG系统，其主要功能如下图。

2024-12-09 17:01:32 285

原创书生浦语大模型教程2-3：提示词工程

Prompt是一种用于指导以大语言模型为代表的生成式人工智能生成内容(文本、图像、视频等)的输入方式。它通常是一个简短的文本或问题，用于描述任务和要求。Prompt可以包含一些特定的关键词或短语，用于引导模型生成符合特定主题或风格的内容。例如，如果我们要生成一篇关于“人工智能”的文章，我们可以使用“人工智能”作为Prompt，让模型生成一篇关于人工智能的介绍、应用、发展等方面的文章。指令要清晰提供参考内容复杂的任务拆分成子任务给 LLM“思考”时间(给出过程)使用外部工具。

2024-12-09 16:49:50 219

原创书生浦语大模型教程2-2：玩转书生「多模态对话」与「AI搜索」

MindSearch是InternLM 组织今年开源的 AI 搜索引擎 (框架)，基于多智能体技术将你提出的问题进行分析、拆解、网页搜索，最终给出有参考依据的高可信度回答。目前可直接在书生·浦语产品内体验以 InternLM2.5-20B 为 Agent 的 MindSearch 官方实现。书生·浦语是InternLM 开源模型官方的对话类产品，可以进行代码编程、文章创作、灵感创意、角色扮演、语言翻译等工作。以“最近大火的中国 3A 大作《黑神话·悟空》它讲了一个什么样的故事？其优点是将思维连可视化出来。

2024-12-09 16:47:29 260

原创书生浦语大模型教程2-1：书生大模型全链路开源体系介绍

书生开源大模型体系包含了数据、训练、微调、部署以及应用等诸多模块，可以完成整个大模型的全流程生态。目前已经建成了OpenCompass评测体系，是Meta认证的中国评测体系。开源模型目前已超过了ChatGPT水平，并且接近GPT4水平。目前已经拥有数据图像60亿、8亿段视频以及1万亿语料。

2024-11-22 17:48:03 184

原创书生浦语大模型教程1-4：huggingface使用与部署

选择created new space。为space 命名并选择静态页面。可见仓库内添加了json文件。修改index.html。

2024-11-14 23:41:42 1018

原创书生浦语大模型教程1-3：git与github使用

除了基本的代码托管功能，GitHub 还提供了丰富的协作工具，例如问题跟踪（Issues）、代码评审（Pull Requests）、项目管理板（Projects）等。总结：Git 是用于版本控制的工具，GitHub 则是基于 Git 的代码托管和协作平台。GitHub 利用了 Git 的强大功能，并在其上添加了许多协作和管理的特性，促进了开源和商业项目的开发。协作功能：GitHub 扩展了 Git 的功能，提供了社交编码的环境，方便开发者之间的协作。首先将本地git配置，输入用户名与邮箱。

2024-11-14 23:31:11 405

原创书生浦语大模型教程1-2：vscode调试与python基础

3. 分析发现有两个问题：1.头尾有多余字符；2.部分值缺少引号。设置断点打印出res的值。直接调试发现有bug。

2024-11-14 23:28:51 460

原创书生浦语大模型教程1-1：Linux 前置基础

命令可以将本地7860与远程7860端口进行映射。一些基础linux命令运行如下图。

2024-11-14 23:22:18 267

原创 InterLM开源生态：Llama3开箱实测

你已经是一只成熟的Llama了，请介绍一下自己：Llama3是一个基于 TensorFlow 的深度学习框架，主要用于自然语言处理（NLP）任务。它提供了一系列的预训练模型和工具，可以帮助开发者快速构建和部署NLP应用程序。Llama3支持多种语言，包括中文、英文、法语等。它也具有良好的可扩展性和可移植性，可以在多种平台上运行。Llama3指令跟随比2代有了很大进步，meta出品值得信赖。

2024-05-05 20:03:39 638 2

原创 OpenCompass 大模型评测实战

OpenCompass是一个开源的开源评测框架，可以进行主观与客观评测。客观评测可以根据答案匹配度判断分数，因此较为简单，客观评价可以快速进行。主观评价可以使用人工评分，也可以使用机器学习评分，当有先进模型A时可以使用A模型给B模型打分，如果没有先进的模型也可以用竞争的方式打分，比如用A模型同时对BC打分，用相对准确度替代绝对准确度。

2024-04-26 15:39:07 527 6

原创 Lagent & AgentLego 智能体应用搭建

智能体指的是可以感知环境并根据观察到的信息作出决策的实体。这些决策旨在实现某种目标或任务。智能体可以是简单的，如一个自动温度调节器，也可以是复杂的，如一个用于高频交易的自动化程序，或者是高级的机器学习模型。自主性：智能体能够在没有外部操作的情况下独立执行任务。社会能力：在多智能体系统中，智能体可以与其他智能体或用户进行交互。反应性：智能体能够感知环境并对变化做出响应。主动性：智能体不仅对环境变化作出反应，还能够自发地采取行动以实现其设计目标。

2024-04-26 15:18:01 337 1

原创 LMDeploy 量化部署 LLM 实践

LMdeploy 有两个功能：量化与部署。量化加快推理速度减少现存占用，部署可以用客户端、网页以及Api迅速调用方便开发者使用。

2024-04-26 14:52:56 457 1

原创 XTuner 微调 LLM

RAG（Retrieval Augmented Generation）技术，通过检索与用户输入相关的信息片段，并结合外部知识库来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战。

2024-04-02 20:45:04 457 1

原创书生·浦语开源大模型全链路开源体系

近些年大模型成为发展通用人工智能的途径，并且离用户越来越近，广泛应用于生产实践中。企业和个人用户对于大模型的需求日益旺盛，而开源模型是对大模型针对性改进的重要途径。书生·浦语大模型包含了7B、20B以及123B等诸多中文预训练模型，为中文应用提供基座模型支撑。同时它整合了大量开源数据集，为国产大模型应用与训练建立数据基础。此外还为模型微调、模型评估、模型推理等建立了相应的程序框架方便了国产大模型的训练和部署。

2024-03-31 17:06:50 254 1