普通网友-CSDN博客

原创 0基础搭建本地私有知识库，给 GPT 插上翅膀，有手就行

如果说，OneAPI 帮你一键封装好所有 LLM 的调用接口，实现。

2025-04-09 10:34:48 572

原创＜大模型应用开发动手做AI Agent＞（附PDF）第一本给程序员看的 AI Agent 图书上市了！

自从 ChatGPT 诞生以来，大模型技术在业界可谓炙手可热，人们从最初的惊叹到现在广泛应用，而人工智能的下一个引爆点很有可能就是 AI Agent。《大模型应用开发：动手做 AI Agent》从零基础出发，介绍了 Agent 的定义、特性与技术架构，还对构建 Agent 的 AI 技术工具进行了详细讲解，最后以 7 个实战项目展示了 Agent 开发的方法。本书的一大特点是。

2025-04-08 15:23:25 735

原创【知识图谱】知识图谱嵌入模型简介

知识图谱通常以三元组 (Triple) 来表示知识，三元组的一般格式为 (头实体关系尾实体)，如“金庸的表兄是徐志摩”表示成三元组为金庸表兄徐志摩)，其中金庸为头实体，徐志摩为尾实体，表兄是这两个实体之间的关系。我们使用小写的字母来分别表示头实体、关系和尾实体，表示知识图谱中的一个三元组。相应地，小写加粗字母分别表示头实体、关系和尾实体对应的嵌入向量。向量的第个元素记作。表示嵌入向量的维度。

2025-04-08 15:19:09 1041

原创【一文读懂】基于Havenask向量检索+大模型，构建可靠的智能问答服务

Havenask 是阿里巴巴广泛使用的自研大规模分布式检索系统，是过去十多年阿里在电商领域积累下来的核心竞争力产品，广泛应用在搜推广和大数据检索等典型场景。在2022年云栖大会-云计算加速开源创新论坛上完成开源首发，同时作为阿里云开放搜索OpenSearch底层搜索引擎，OpenSearch 自2014年商业化，目前已有千余家外部客户。

2025-04-08 15:14:43 796

原创【向量数据库｜一文全面了解向量数据库的基本概念、原理、算法、选型】

向量数据库的原理和实现，包括向量数据库的基本概念、相似性搜索算法、相似性测量算法、过滤算法和向量数据库的选型等等。向量数据库是崭新的领域，目前大部分向量数据库公司的估值乘着 AI 和 GPT 的东风从而飞速的增长，但是在实际的业务场景中，目前向量数据库的应用场景还比较少，抛开浮躁的外衣，向量数据库的应用场景还需要开发者们和业务专家们去挖掘。

2025-04-08 15:09:31 1143

上面我们用Iris鸢尾花数据集试了不同的超参自动调优方法，发现贝叶斯优化和随机搜索都比格子搜索好。从一些论文反映，贝叶斯优化是更香的，但是贝叶斯优化好像在实践中用的不是那么多，网上也有很多分享者，像Nagesh Singh Chauhan，说的那样：[10]为什么呢？我想原因是贝叶斯的开销太大了，前面有提到，在每次循环选超参值的时候，贝叶斯优化都需要将带入昂贵的目标函数中，去得到输出值y，当目标函数特别复杂时，这种情况的评估开销是很大的，更何况随着搜索空间和搜索次数的变大，计算会越发昂贵。

2025-04-08 12:00:44 902

原创【人工智能】未来已来，国内10家AI大模型盘点

阿里达摩院推出的大模型，拥有千亿参数，可用于智能问答、知识检索、文案创作等场景。

2025-04-08 11:56:47 1055

原创【建议收藏】小白必用上手秘籍 DeepSeek！新手必看保姆级教程！！

•。

2025-04-08 11:47:55 539

原创【工业大模型】2025年10个工业大模型值得期待

编者按：工业大模型是推动制造业智能化转型的关键，也是推进新型工业化发展的重要驱动力。不同于以往人工智能技术在单一工业场景的应用，工业大模型正在逐渐融入软件设计、生产控制、运营管理等产品全生命周期各生产环节，加速推动制造业迈向数字化、网络化、智能化新阶段。当前，伴随技术、应用瓶颈不断被突破，工业大模型加速落地。《中国电子报》对目前市面上的工业大模型产品进行了梳理，并选出10个工业大模型，我们将在2025年着重关注它们的应用表现，由衷期待它们能在推进新型工业化征程中发挥更大作用。

2025-04-07 16:18:52 427

原创【大模型微调】一文掌握7种大模型微调的方法

本篇文章深入分析了大型模型微调的基本理念和多样化技术，细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景，使得读者可以依据特定的应用要求和计算资源限制，挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段：阶段一：预训练阶段在这个阶段，大型模型会在大规模的无标签数据集上接受训练，目标是使模型掌握语言的统计特征和基础知识。

2025-04-07 14:16:38 254

原创【大模型时代】ChatGPT开启通用人工智能浪潮：大模型书籍分享（附PDF）

讲述ChatGPT大模型的前世今生和台前幕后。

2025-04-07 14:11:25 568

原创【大模型部署】本地部署FastGPT使用在线大语言模型

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力，它背后依赖OneApi开源项目来访问各种大语言模型提供的能力。各大语言模型提供的访问接口规范不尽相同，为此OneApi项目提供了统一的API接口去对接各种大语言模型。FastGPT的部署架构如图所示：本文章将介绍如何部署OneApi和FastGPT，以及两种在线大语言模型（和）的配置方法。

2025-04-07 12:23:59 1038

原创【大模型】RAG效果优化：高质量文档解析详解

基于PDFPlumber将pdf中的文字部分提取出来，得到words集合，并基于words位置关系检测文本行（lines）。

2025-04-07 12:19:44 1028

原创【从理论到实践】AI大模型学习路线：全面提升核心竞争力，一篇掌握！

大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，这些参数就像是大脑中的神经元，它们通过复杂的计算来理解和生成语言、图片等。举个例子，你可能听说过GPT-3，它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题，然后给出回答，或者根据你给它的提示，生成一篇文章、一个故事，甚至是一段代码。

2025-04-07 12:15:17 651

原创【保姆级教程】本地离线部署大模型Ollama+AnythingLLM！

好多同学不知道怎么下载需要用到的工具，我这里给大家都准备好了，需要的文末领取。qwen7b.gguf是阿里巴巴的通义千问大模型，7B大模型，7亿参数，至少需要8G内存，越大回复越流畅，下载完后，双击OllamaSetup，自动安装成功，默认安装在C盘，不能选择安装路径的哦，安装完后，右下角会出现Ollama图标。

2025-04-07 12:08:51 376

原创【NLP修炼系列之Bert】Bert多分类&多标签文本分类实战（附源码）

本文是Bert文本多分类和多标签文本分类实战，其中多分类项目是借鉴github中被引用次数比较多的优秀项目，多标签文本分类是我在公司业务中实际用到的线上项目，今天把两个项目都介绍给大家，其实Bert做文本分类项目都大差不差，两个项目的项目结构也都差不多，这样更容易被初学者迅速入手和理解。文本多分类任务用到的数据集是THUCNews数据集中抽取20w新闻标题，文本长度在20-30之间，一共10个类别，每个类别2万条。类别：财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐。

2025-04-06 16:55:24 919

原创【LLM大模型】大模型高效微调-LoRA原理详解和训练过程深入分析

LoRA与训练目标是解耦的，但本文设定就是语言模型建模。以下将给出语言建模（可自然推广到序列建模）的基本符号定义，即最大化给定提示的条件概率（本质是极大似然估计）。给定一个参数为ΦΦ预训练的自回归语言模型PΦ(y|x)PΦ(y|x)。xx为输入，yy为输出note: 为与原文符号一致，下文ΦΦ、ΘΘ、WW均表示模型参数全参数微调每次full fine-tuning训练，学一个 ΔΦΔΦ，|ΔΦ||ΔΦ| 参数量大hold不住语言模型的条件概率分布建模目标高效微调。

2025-04-06 11:27:02 1092

原创【LLM大模型】LangChain之工具Tools（上）

工具是代理、链或LLM可以用来与世界互动的接口。javascript代码解读工具的名称工具的描述该工具输入的JSON模式要调用的函数是否应将工具结果直接返回给用户LangChain通过提供统一框架集成功能的具体实现。在框架内，每个功能被封装成一个工具，具有自己的输入输出及处理方法。代理接收任务后，通过大模型推理选择适合的工具处理任务。一旦选定，LangChain将任务输入传递给该工具，工具处理输入生成输出。输出经过大模型推理，可用于其他工具的输入或作为最终结果返回给用户。

2025-04-06 11:22:43 554

原创【LangChain-Chatchat】本地部署模型及搭建个人企业内部知识库

基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，开源、可离线部署的检索增强生成(RAG)大模型知识库项目。该项目支持开源 LLM 与 Embedding 模型，亦可实现全部使用开源模型离线私有部署。与此同时，也支持 OpenAI GPT API 的调用，当前最新版本为0.2.10。0.3x版本可以关注作者的项目地址。支持加载本地模型及联网模型如智谱AI、阿里云通义千问、百川、讯飞星火、百度千帆、字节火山方舟、ChatGPT、Gimini和Azure OpenAI。

2025-04-06 11:10:52 1674

原创【Docker保姆级教程】如何安装和使用Docker

Docker是一种开源容器化技术，它允许开发者将应用及其依赖打包到一个轻量级、可移植的容器中。这种方法确保了应用在不同环境中的一致性和效率。Docker的出现标志着云计算和微服务架构的一个重要转折点。通过对Docker的深入探讨，我们可以看到Docker作为一种现代化的容器化技术，在技术领域的影响是多方面的。从Docker的简介到其架构和组件的全面解析，再到实际的安装、配置和基本命令操作，我们了解了Docker如何将复杂的应用容器化过程变得简单高效。

2025-04-05 17:32:23 1114

原创【AI学习】一文带你了解国内可能平替ChatGPT的8个免费AI大模型应用

基于千亿基座模型 GLM-130B，注入代码预训练，通过有监督微调等技术实现人类意图对齐，具备问答、多轮对话、代码生成功能的中英双语大模型。

2025-04-05 17:28:49 711

原创【AI落地应用实战】RAGFlow + 知识图谱 + Deepseek 初步探索

用RAG搭建过知识库就知道，在使用RAG搭建知识库的时候，

2025-04-05 17:24:56 911

原创【AI大模型应用实战】零基础入门AI+知识图谱：使用LangChain轻松构建与查询（含详细代码及源码解析

知识图谱是一种结构化的语义知识库，它通过图的形式存储和表示实体（如人、地点、组织等）以及实体之间的关系（如人物关系、地理位置关系等）。知识图谱通常用于增强搜索引擎的语义理解能力，提供更丰富的信息和更准确的搜索结果。知识图谱的主要特点包括：1实体(Entity)：知识图谱中的基本单元，代表现实世界中的一个对象或概念。2关系(Relation)：实体之间的联系，如“属于”、“位于”、“创立者”等。3属性(Attribute)：实体所具有的描述性信息，如人的年龄、地点的经纬度等。4。

2025-04-05 10:39:51 736

原创【AI大模型应用开发】3.2 RAG实战 - RAG应用+UI实现加载本地文件并对话

前面我们实现了RAG基本流程，今天我们在此基础上给它加个UI界面，在浏览器打开，实现上传本地文件、解析，并用大模型实现与该文档的对话。也就是一个阉割版demo版的ChatPDF或知识库对话系统。界面采用Python的gradio库，这个库在机器学习和大模型界很火，它运行后会启动一个Web服务器，并在默认浏览器中打开一个新页面，显示Gradio界面。别问为啥用这个，就是看大模型的界面好多都是这个库搭的，所以也就用一下。不会gradio没关系，就几行代码，很容易理解。

2025-04-05 10:36:09 671

原创【AI大模型面试】LoRA和全量微调有何不同？被问了不下5遍

本文旨在了解两种微调大型语言模型方法之间的差异：完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下游任务，但它们却有所不同。微调（Fine-tuning）是将经过预训练的大语言模型应用于下游任务的关键范例。最近，低秩自适应 (LoRA) 等方法已被证明可以在各种任务上达到完全微调模型的性能，同时可训练参数的数量却大大减少。这就提出一个问题，即它们学到的解决方案真的等效吗？

2025-04-05 10:32:14 1040

原创【AI大模型】羊驼大模型详解_大模型羊驼

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。AI大模型应用所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。模型的提升一般模型本身没有多大的进化，主要的提升是。

2025-04-05 10:27:27 720

原创【AI大模型】LLM 学习之「向量数据库」

向量数据库是一种以向量或数据点的数学表示形式存储数据的数据库。人工智能和机器学习使非结构化数据能够转换为捕获意义和上下文的数字表示（向量），这得益于自然语言处理和计算机视觉的进步。矢量相似性搜索（VSS）是矢量数据库的关键功能。它是查找与向量数据库中给定查询向量相似的数据点的过程。常用的 VSS 用途包括推荐系统、图像和视频搜索、自然语言处理和异常检测。例如，如果构建推荐系统，则可以使用 VSS 查找（并建议）与用户以前表现出兴趣的产品类似的产品。信息有多种形式。

2025-04-04 14:21:42 836

原创【AI】DeepSeek 在 Cursor 中的应用

原文：ai.fullstack.ren/app/deepsee…

2025-04-04 14:12:32 619

原创【2025首发】AI大模型学习路线：适合新手和大学生的详细指南与技巧！

人工智能已经成为了现代技术的重要组成部分，所以开发人员学习人工智能是非常必要的。人工智能是未来的趋势：人工智能已经成为了未来技术的趋势，它将会在各个领域发挥重要作用，包括医疗、金融、交通、教育等等。人工智能可以提高开发效率：人工智能可以自动化一些重复性的工作，比如数据分析、图像识别等等，这样可以提高开发效率，减少开发时间和成本。人工智能可以提高产品质量：人工智能可以通过分析数据和模式来预测和避免错误，从而提高产品的质量和可靠性。

2025-04-04 10:53:38 741

原创「零代码+免费+联网搜索」保姆级教程：10分钟用DeepSeek+AnythingLLM搭建你的专属AI知识库

功能亮点：支持多用户协作、多模型接入（如DeepSeek、OpenAI）、多向量数据库（如LanceDB、Pinecone）。部署方式：提供Docker镜像和桌面版，本文以桌面版为例。通过本文，你已掌握使用AnythingLLM+DeepSeek API构建私有知识库的全流程。无论是个人学习笔记管理，还是企业级知识沉淀，这一方案都能在保障一定隐私的前提下，大幅提升信息处理效率。立即行动，让你的数据真正“活”起来！

2025-04-04 10:40:54 707

原创《动手做AI Agent》，产品经理的AI智能体设计指南（附PDF）

在 AI 方面，产品经理要了解机器学习、深度学习、自然语言处理等理论知识，还要知道基于这些理论构建的技术是如何影响产品设计、用户体验和业务流程的。AI Agent 就将多项技术工具整合在一起，从而提供了个性化服务、自动化任务执行和智能决策支持。从原理出发，结合应用场景思考，产品经理就能在产品规划和设计中充分发挥出 Agent 的潜力。

2025-04-04 10:29:04 1091

原创 “AI训练师”是个啥职业？为你揭秘！

你听说过“AI训练师”吗？今年2月,“AI训练师”正式成为新职业并纳入国家职业分类目录。这到底是个啥职业？有何发展前景？夸克搜索AI训练师小寇与我们分享了他的故事。小寇成为一名AI训练师完全是机缘巧合。在上一家公司内部架构调整后，他从传统互联网产品经理摇身一变成为AI训练师。从进入完全陌生的AI业务到现在，已有3年时间。“我们发现很多用户在识图搜索时，出于好奇会自拍人脸。于是，我们赋予AI对颜值进行打分的能力，但评测发现AI对颜值的‘要求’太高，很多照片被打了低分。

2025-04-03 16:30:48 519

原创 [论文] 异构GPU集群上大模型训练推理续

HAP是一个自动化系统，旨在加速在异构集群上的SPMD（Single-Program-Multiple-Data）类型模型训练。

2025-04-03 16:25:06 637

原创 # Ollama+LobeChat：在个人电脑上打造无限制、高颜值、免费的专属大模型助手！

OllamaOllama是一个开源的大模型托管和服务平台，可以在Windows、macOS、Linux或Docker中安装，并提供便利的模型下载、推理等功能，简直把大模型的落地做到了0基础即可入手的地步。项目的Logo就是下面的这只可爱的小羊驼。LobeChat说起来LobeChat是与NextChat几乎同期起步的大模型客户端项目，二者也先后从开源走向商业化（除了开源，官方也提供商业服务），不过笔者个人感受下来，LobeChat在整体质感和功能特性方面更受一筹。

2025-04-03 16:17:40 906

原创 AI副业普通人如何通过AI绘画赚钱？

AIGC现已成为内容生产的引擎，正为内容创作领域带来前所未有的变革。它不仅能够在文本、图像、视频、音频等单一模态上生成内容，更能实现跨模态的生成，打通了多模态间的壁垒。对于“普通人”来说，理解并有效的学会利用AI，让自己的能力变宽，增强个人在职场上的竞争力，大大地提高工作效率，同时还可以向上探索更多副业的可能性。这里为什么强调“普通人”，因为大佬无论在哪个时代，都是有自保能力的，而普通人的生活和命运，却有可能被 AI 冲击的七零八落。

2024-12-13 10:03:01 736

原创 AIGC入门基础教程：详尽指南，从入门到精通一文搞定

接下来，小编将以图文的方式，快速引领大家初步了解什么是AIGC？在数字化和人工智能迅猛发展的今天，AIGC——人工智能生成内容，正逐渐成为瞩目的焦点。它为创意性工作打开了全新的大门，尤其在文本和视觉内容创作方面表现卓越。本文旨在为初学者提供一个关于AIGC的浅显易懂的入门指南，包括其原理、未来发展趋势和实际应用等方面。AIGC是一项结合了人工智能和大数据技术的创新内容生成工具。它能够帮助用户以更快速、更高效的方式完成各类任务，如写作、翻译和设计等。

2024-12-12 10:59:21 1066

原创 AIGC如何改变我们的生活

视频生成与图像生成在原理上有一定相似性，可分为视频编辑(如画质修复、视频特效、视频换脸等)、视频自动剪辑和端到端视频生成(如文字生成视频等)。AIGC可以包括各种形式的内容，如文章、新闻、音乐、绘画视频等。case场景的图像，如下图所示，展示的就是算法生成的图像，虽然生成的图像真实度还有进步空间，但是也给我们打开了新的一扇大门，大规模的生成用于AI算法训练的数据集。AIGC 助力商品建模，改善购物体验，AIGC 技术可以通过视觉算法生成商品的三维模型，提供多方位视觉体验，节省沟通成本，改善用户体验。

2024-12-12 10:57:09 938

空空如也

空空如也