mengrennwpu-CSDN博客

OpenAI的Sora项目早期邀请众多艺术家成为测试者、红队成员以及创意合作伙伴，但艺术家们感觉被背刺了。忙活了一顿，艺术家们感觉自己的艺术产物主要作用是给OpenAi的Sora做宣传。因此，艺术家们联名并在HuggingFace上发布公开信，且将sora的艺术创作链接一并提供出来，虽然该链接在公开信发布3个小时后就被OpenAI下线掉了...

2024-11-27 12:07:32 922

原创 LLM应用实战: 给个公司简称，输出公司全称

开发了一款基于公司简称补全公司全称的工具，包括具体的框架、实现原理以及完整源码，满满诚意，提供给各位看官。欢迎转发、订阅~有问题可以私信或留言沟通！

2024-11-18 18:01:49 1206 1

原创 LLM应用实战: AI资讯的自动聚合及报告生成

本qiang~开发了一款AI资讯的自动聚合及报告生成工具，包括具体的框架、实现原理以及完整源码，满满诚意，提供给各位看官。欢迎转发、订阅~

2024-11-06 12:31:23 1806 1

原创 LLM论文研读: GraphRAG的替代者LightRAG

本文针对开源的LightRAG论文研读以及原理分析，包括核心模块、框架的整体工作流程等内容。

2024-10-30 14:12:44 1421

原创 LLM应用实战: OpenAI多代理新作-Swarm

本文主要是OpenAI开源multi-agent框架swarm进行介绍，包括其核心组件Agent, instructions,functions，多个Agent之间如何进行切换，以及针对其中的examples进行验证，框架及源码非常简单，看官们可以亲自尝试一下。

2024-10-22 12:43:37 1399

原创 LLM应用实战: 文档问答系统Kotaemon-1. 简介及部署实践

本篇主要是Kotaemon的简介信息，涉及到主要特点，与传统文档RAG的区别，如何部署、以及效果演示

2024-09-18 08:49:54 2241 3

原创 LLM论文研读: MindSearch

本文主要是针对MindSearch进行研读，掌握其中的原理及思想，且部署验证了效果

2024-08-30 14:58:18 1426

原创 LLM应用实战: 产业治理多标签分类

本期的干货就是分享关于如何基于LLM实现数量多、层级多的多标签分类的实战经验，各位读者可以参考借鉴。

2024-08-20 17:06:51 1086

原创 LLM应用实战：当图谱问答(KBQA)集成大模型(三)

本文主要是针对KBQA方案基于LLM实现存在的问题进行优化，主要涉及到响应时间提升优化以及多轮对话效果优化，提供了具体的优化方案以及相应的prompt。

2024-06-12 12:09:38 1282

原创 LLM实战：当网页爬虫集成gpt3.5

本文主要是通过Scrapegraph-ai集成gpt3.5实现一个简单的网页爬取并解析的demo应用，其中涉及到gpt3.5免费申请，Scrapegraph-ai底层原理简介，demo应用源码等。

2024-05-20 20:43:23 1712

原创 LLM实战：LLM微调加速神器-Unsloth + Qwen1.5

本文主要是使用unsloth框架针对Qwen1.5的高效微调实验，提供了详细的对比代码以及不同维度的对比分析结果。

2024-05-16 20:55:58 2971

原创 LLM实战：LLM微调加速神器-Unsloth + LLama3

本文主要是使用unsloth框架针对llama3的高效微调实验，提供了详细的对比代码以及不同维度的对比分析结果。

2024-05-13 22:02:20 3082

原创 LLM优化：开源星火13B显卡及内存占用优化

本文主要是针对开源星火13B的显存及内存占用过大的一个代码优化。核心思想是使用CPU预加载模型，再转换至GPU。

2024-04-28 16:37:23 1476

原创 LLM应用实战：当KBQA集成LLM(二)

本文主要是针对KBQA方案基于LLM实现存在的问题进行优化，主要涉及到图谱存储至Es，且支持Es的向量检索，还有解决了一部分基于属性值倒查实体的场景，且效果相对提升。

2024-04-25 20:56:30 1362 3

原创 LLM应用实战：当KBQA集成LLM

将传统KBQA中的部分模块，如NLU、指代消解、实体对齐等任务，完全由LLM实现

2024-04-11 10:47:51 818

原创 LLM面面观之MoE

此文是本qiang~针对大语言模型的MoE的整理，包括原理、流程及部分源码

2024-04-02 09:17:55 839

原创 LLM面面观之RLHF平替算法DPO

此文是本qiang~针对大语言模型的DPO算法的整理，包括原理、流程及部分源码。

2024-01-31 12:20:01 2217 1

原创 LLM面面观之LLM上下文扩展方案

本文主要展示了LLM长文本扩展的方法，包括位置插值、LongLoRA、LongQLoRA等论文的简单概述。

2024-01-22 12:57:28 1253

原创 LLM面面观之LLM复读机问题及解决方案

LLM复读机产生的原因以及对应的解决方案

2023-12-14 14:17:24 3350

原创 LLM面面观之Prefix LM vs Causal LM

前缀语言模型可以根据给定的前缀生成后续的文本，而因果语言模型只能根据之前的文本生成后续的文本。

2023-11-29 14:29:36 3055

原创 Meta AI新发布的超大规模语言模型-OPT-175B

Meta AI在2022年5月3日新发布的OPT-175B模型，该模型是现阶段第一个模型参数超过千亿级别的模型，其次该模型与GPT-3相比，更加开放及便于访问。具体开放性表现在如下几个方面：1.论文: 提供了某些能力是可能的存在证明，并揭示可以建立在此基础上的一般思想2.API访问:允许研究人员探索和评估现有基础模型的能力(例如，推理)和局限性(例如，偏差)3. 模型权重:允许研究人员逐步改进现有模型，开发更深入的可解释技术和更有效的微调方法4. 训练数据:让研究人员更好地理解训练数..

2022-05-04 11:37:20 2223

转载 12个进程管理命令介绍

转自https://linux.cn/article-5557-1.html执行中的程序在称作进程。当程序以可执行文件存放在存储中，并且运行的时候，每个进程会被动态得分配系统资源、内存、安全属性和与之相关的状态。可以有多个进程关联到同一个程序，并同时执行不会互相干扰。操作系统会有效地管理和追踪所有运行着的进程。为了管理这些进程，用户应该能够：查看所有运行中的进程查看进程消耗资源

2015-06-06 10:25:40 704

原创 Linux学习笔记（十四）进程

进程是如何工作的：当系统启动的时候，内核先把一些自己的程序初始化为进程，然后运行一个叫做init的程序。init再依次运行一系列的称为init脚本的shell脚本（位于/etc），它们可以启动所有的系统服务。其中许多系统服务以守护(daemon)程序的形式实现，守护程序仅在后台运行，没有任何用户接口。这样，即使我们没有登录系统，至少系统也在忙于执行一些例行事务。内核维护每个进程的信息，以此

2014-09-24 11:44:10 779