- 博客(969)
- 收藏
- 关注

原创 DeepSeek本地部署+投喂数据训练AI教程!!
DeepSeek-R1,是深度求索(DeepSeek)研发的推理模型,本地部署后完全免费,无使用次数限制。DeepSeek-R1采用的大规模强化学习技术,尤其擅长数学、代码和自然语言推理等复杂任务。DeepSeek-R1系列模型(1.5b~671b)开源且免费,进一步降低了AI应用门槛,赋能开源社区发展。使用教程❶Win版安装教程(Ollama+AnythingLLM安装、DeepSeek模型下载)❷Mac版安装教程(Ollama+AnythingLLM安装、DeepSeek模型下载)
2025-02-05 13:49:42
131227
20

原创 【手把手教你】搭建私有大模型+私有知识库
就是把目前最流行的开源大模型部署到自己的电脑上,无需联网、也不用买会员,隐私可不会泄露,直接可以和AI聊天。就是你可以把你喜欢的资料统统喂给大模型,然后让AI查询你指定的材料,再来回复你的问题。若是在公司搭建这套组合,可以把公司的介绍、产品数据、销售数据等等都发给私有大模型,回复用户的信息就更有针对性。大模型搭建已经分享过了,就不在此赘述,直接进入主题,知识库搭建。AnthingLLM可以直接在其界面上对话,导入各种形式的资料。也可以把本地AI大模型和知识库做成接口API,在企业的其他应用里面去调用。
2024-12-09 17:49:19
3791

原创 Llama3微调教程:超简单,人人都可以打造属于自己的GPT!
本教程详细介绍了如何使用Unsloth和Google Colab环境对Llama 3进行微调。使用Colab基本上是无脑点击运行就好了。经过这个教程,我们发现微调模型主要有三个核心环节:数据准备,这一步决定了质量;模型训练,这一步硬件资源决定了时间;模型测试,因为我们初步体验,所以比较简略,后续可以进一步探讨。通过本教程,即使是AI领域的新手也能够掌握大模型的微调技术。Unsloth不仅降低了技术门槛,也为个人和小团队提供了强大的工具。如果还有问题,可以查看我的notebook或者进群讨论。
2024-05-29 17:45:59
10730
2

原创 『保姆级』大模型教程来了(从入门到实战)
在大模型的构建之下,AI自动化交互,将会决定世界的未来,谁的大模型更强大,将决定在遥远的未来的话语权,同时,大模型会成为AI基础设施。AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,🔻 针对ChatGLM大模型,介绍ChatGLM模型微调。🔻 大模型的定义和特点,如预训练、微调、指令学习等。🔻 05 精读大模型-3论文、Instruct论文。🔻 04 GLM-130B训练营——论文泛读。🔻 05 GLM-130B训练营——论文精读。🔻 08 Alpaca训练营——论文精读。
2024-04-01 17:50:11
5465
原创 想入门大模型,一文了解大模型应用基本概念
大语言模型(LLM,Large Language Model),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。LLM 通常指包含数百亿(或更多)参数的语言模型,它们在海量的文本数据上进行训练,从而获得对语言深层次的理解。 你可以把大语言模型想象成一个超级学霸,它读了互联网上无数的书、文章、对话,学会了人类语言的规律。当你问它问题或让它写东西时,它就能像人一样回答你,甚至写诗、编故事、解数学题。
2025-05-20 15:04:23
635
原创 Markdown + AI = 效率神器:10分钟就能学会的大模型文本格式!
Markdown是一种轻量级标记语言,由John Gruber于2004年创建。它使用纯文本格式编写文档,然后转换成有效的HTML文档。与复杂的文字处理软件不同,Markdown让你专注于内容本身,而不是繁琐的排版。最令人惊叹的是,Markdown的语法极其简单,几乎不需要学习成本。它的设计理念是"易读易写"——即使是原始的Markdown文本,也能轻松阅读,不会被标记符号干扰。
2025-05-20 14:45:21
365
原创 从零开始打造MCP+Ollama集成,实战教程来了!
在过去一两个个月里,模型上下文协议(Model Context Protocol,MCP)频繁出现在各种技术微信交流群中。我们已经看到了许多很酷的集成案例,大家似乎相信这个标准会长期存在,因为它为大模型与工具或软件的集成设立了规范。今天,向大家展示如何实现Ollama与MCP服务器的集成。
2025-05-19 15:45:35
597
原创 医疗大模型微调是什么?医疗大模型微调入门到精通,收藏这一篇就够了!
首先,整个项目的灵感源于一档名为《十字路口》的播客中分享的“2024年最令人惊艳的十大AI落地项目”之一。项目详情如下:某全国万店连锁药房推出驻店销售APP,可对到店客户的病情描述进行录音并转为文字输入大模型。大模型输出对应药品介绍及推销文案,辅助销售人员完成高利润药品的推荐。与传统AI辅助应用不同
2025-05-19 15:40:13
827
原创 一文全面汇总大模型技术生态!
大语言模型(Large Language Model, LLM)是人工智能领域的核心技术,基于Transformer架构,通过海量数据预训练和微调,实现对自然语言的深度理解与生成能力。其核心原理包含以下关键要素:
2025-05-16 14:57:49
804
原创 一文讲清楚AI产品经理如何绘制AI产品架构图!
在生成式AI浪潮席卷各行业的当下,众多企业都在思索一个问题:大模型究竟能为企业经营带来哪些实质性价值?AI产品经理正处于这场产业升级的“核心枢纽”——不仅要懂模型、懂业务,还要有能力凭借一张“看得懂、讲得通、可落地”的架构图,将技术蓝图转化为企业经营的实际解决方案。不少AI产品经理在面对大模型时,容易陷入“空谈能力,不谈落地”或“只看应用,不懂底层”的误区。如何让一张产品架构图既展现AI能力的全貌,又紧密贴合企业经营的真实场景?本文将围绕这一问题,从AI能力体系、企业职能渗透、核心场景构建,再到关键产品
2025-05-16 14:37:03
454
原创 一文讲清楚DeepSeek大模型61个应用场景
随着科技的飞速发展,人工智能(AI)已经成为推动社会进步的重要力量。其中,人工智能大模型作为AI领域的璀璨明珠,凭借其强大的处理能力和广泛的应用场景,正逐步改变着我们的生活和工作方式。 在当今科技飞速发展的时代,人工智能已然成为引领创新潮流的先锋力量,而在中国这片充满创新活力的土地上,DeepSeek犹如一颗冉冉升起的璀璨之星,正以其独特的技术优势、创新的商业模式和巨大的发展潜力,震惊着整个世界。
2025-05-15 14:48:09
1161
原创 全网最全!大家经常说的大模型,到底什么是大模型,大模型的具体应用,一文说清楚
在当今科技飞速发展的时代,“大模型” 一词频繁出现在人们的视野中,成为人工智能领域的焦点。那么,大模型究竟是什么?它又有着怎样令人惊叹的应用呢?本文将为你一一揭晓。
2025-05-15 14:31:53
841
原创 DeepSeek 20个最强组合应用,建议收藏!
DeepSeek + PowerBI:成为决策预言家,助力数据分析。消除个人数据分析能力门槛,通过自然语言交互,无需掌握复杂的 DAX 公式和 M 语言,即可实现零门槛的数据分析,能直接用普通话指令生成代码、优化查询、解释复杂公式原理,还可动态迭代数据模型,实现跨领域专业分析。
2025-05-14 14:25:19
1325
原创 如何微调一个和你一样说话风格的大模型?(附教程)
在当前的大语言模型(LLMs)领域,绝大多数实力强劲的模型,在推理运行方面都对硬件资源有着极高的需求。哪怕只是单个大型模型实例,一般也需要普通用户难以获取的硬件资源,除非愿意在云基础设施上投入巨额资金。虽然借助蒸馏和量化等技术手段,能够减小这些大型模型的规模,使得它们能够在诸如游戏电脑这样的消费级硬件上进行推理任务。但即便如此,对于这些经过缩小的模型而言,如果想要进行训练或微调,在期望全精度微调的情况下,依然需要极为强大的硬件资源。不过,要是放弃全精度、全量微调的条件,那么训练或微调的过程就可以在自己现
2025-05-14 14:21:55
764
原创 一文搞懂:大模型训练过程详解,AI 大模型落地必备知识
踏入2025年,DeepSeek迅速走红,这股热潮也让大众对LLM(Large Language Model,大语言模型)的好奇与热情持续高涨。在不少人心中,LLM的神奇表现就像魔法一样令人着迷。那么,大语言模型究竟有着怎样不为人知的一面呢?让我们一探究竟。想要真正了解LLM,就需要深入其核心——细致研究这些模型从架构设计、数据训练,到参数优化的每一个环节,弄清楚它们是如何一步步发展成为如今我们日常使用的AI大模型的。
2025-05-13 14:23:25
1069
原创 产品经理必备!如何用AI提升产品管理工作效率
我是一名产品经理,目前在做HR SaaS产品,从去年11月开始至今一直在接触AI,探索它在产品经理工作中的应用,今天就跟你分享对我来说最有用的四个AI Agent,希望对你的工作效率提升有所帮助。
2025-05-13 14:07:40
674
原创 Dify案例分享|0代码搭建Text2SQL智能查询系统!自然语言秒变SQL,Dify+知识库+Agent全搞定
Text2SQL(又称NL2SQL) 作为一项自然语言处理技术,其核心在于将自然语言(Natural Language)表述的问题,转化为能够在关系型数据库中执行的结构化查询语言(Structured Query Language,SQL),以此实现与数据库之间的查询交互。这项技术的关键目标在于,借助自然语言描述,让用户即便不具备SQL语法知识,也能够顺利完成复杂的数据库查询任务。具体而言,Text2SQL的任务涵盖以下几个步骤:
2025-05-12 15:04:45
1058
原创 一文读懂2025年DeepSeek、Manus与AI+Agent行业现状(全52页)
ChatGPT没爆火之前,各种各样的机器学习模型其实已经发展多年,都是为了解决某一个特定领域的问题;今年Manus也火了一下,但是远远没有达到落地的地步,Maus其核心思想Agent其实也一直在研究,只是Agent也是先解决某一个特定领域的问题。而通用性的Agent,还缺少一个合适的时机,能够让通用的Agent的能够爆火一下,真正的AI革命才开始,我们可以从Manus的整个雏形上能看到AI能够帮人类解决大量的问题。那么Agent到底是什么呢,简单来说,大模型是大脑的话,Agent更像是一个完整的人,它包
2025-05-12 14:57:00
1127
原创 从RAG到CoT再到MCP,一文读懂AI Agent落地难题
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。大模型行业面临算力瓶颈、主流架构局限等问题,这些可能会对行业的增长速度产生一定影响。
2025-05-10 14:10:55
1003
原创 将Dify接入到小米音箱:无需一行代码搭建你的专属语音助手
修改.env配置文件,将Dify暴露的OpenAI应用端点信息填好,参考上一步。修改.migpt.js配置文件,将系统提示词置空。上述配置文件修改完成之后,重启一下mi-gpt服务。后续所有的改动只需要通过dify页面作修改即可,再也不需要改动mi-gpt服务配置了!上面我们通过将Dify应用发布为OpenAI兼容的API,轻松地完成了与小米音箱的对接。这一过程不仅展示了Dify的强大灵活性和兼容性,还为我们在其他智能产品的应用中提供了无限的遐想空间。
2025-05-10 14:03:45
833
原创 AI大模型·白皮书 | 2025大模型原理、技术与应用:从GPT到DeepSeek(附PDF)
2025大模型原理、技术与应用:从GPT到DeepSeek报告围绕大模型展开,涵盖自然语言处理发展、GPT与DeepSeek模型剖析、应用以及未来展望等内容。 1. 自然语言处理与大模型概述:语言是人类交流和知识传承的关键工具,自然语言处理(NLP)旨在用计算机理解和生成自然语言,处于人工智能的核心地位,历经五次范式变迁。大模型(大语言模型)的出现推动NLP进入新阶段,其中GPT具有开创性意义 。 2. GPT系列模型解析:GPT采用语言模型预训练任务,基于Transformer模型,通过
2025-05-09 15:10:08
275
原创 大模型微调(Fine-tuning)全解,需要了解的都在这里
所谓大模型微调,指的在已有的大规模预训练模型基础上,通过对标注数据进行训练,进一步优化 模型的表现,以适应特定任务或场景的需求。不同于RAG或者Agent技术,通过搭建工作流来优化模型表现,微调是通过修改模型参数来优化模型能力,是一种能够让模型“永久”掌握某种能力的方法。
2025-05-09 15:06:59
585
原创 大模型应用开发:从0基础入门到项目实战,教你动手做AI Agent!
对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。《动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。按照“基础知识——技术工具——项目实战”三部分来组织内容,帮助读者从理论学习推进到动手实际操作。
2025-05-08 14:24:27
521
原创 想入门大模型?这篇指南不可错过
大模型,通常指的是参数规模极大的深度学习模型。以 GPT - 3 为例,它拥有高达 1750 亿个参数,如此庞大的参数量赋予了模型超强的学习和表达能力。这些模型通过对海量数据的深度挖掘和学习,能够捕捉到数据中复杂的模式和特征。其训练数据来源广泛,涵盖互联网上的各类文本,如百科知识、新闻资讯、社交媒体内容以及图书文献等。大模型本质上是 “大数据 + 大算力 + 强算法” 的结晶,是凝聚大数据内在精华的 “隐式知识库”。
2025-05-08 14:20:01
750
原创 神书《从零构建大模型》分享,尚未发布,GitHub标星22k!!
从零构建大模型》是一本即将于今年10月底发布的书籍,github已经吸引了惊人的21.7k标星!作者是威斯康星大学麦迪逊分校的终身教授,在GitHub、油管、X上拥有大量粉丝,是一位真正的大佬。在本书中,读者将从内到外了解 LLM 的工作原理。在这本富有洞察力的书中,畅销书作家 Sebastian Raschka 将指导读者逐步创建自己的 LLM,并用清晰的文本、图表和示例解释每个阶段。读者将从最初的设计和创建到在通用语料库上进行预训练,再到针对特定任务进行微调。
2025-05-07 14:13:48
752
原创 大模型算法工程师备考攻略
大模型算法工程师这一岗位,如今在科技行业中热度极高,它要求从业者具备深厚的技术功底,涵盖数学知识、编程技能,以及对机器学习、深度学习尤其是大模型相关技术的深入理解。如果你正打算备考成为一名大模型算法工程师,这份攻略希望可以帮到你。
2025-05-07 14:03:59
1169
原创 小白学大模型:多模态 Qwen2.5-VL 入门指南
Qwen2.5-VL 将视觉和语言能力结合,像一个“全能助手”帮你处理图片、视频和文字任务。无论是学生、开发者还是企业,都能用它提升效率。未来,随着模型优化,它可能在自动驾驶、虚拟现实等领域发挥更大作用。
2025-05-06 11:55:03
826
原创 【2025版附安装包】超详细Python+Pycharm安装保姆级教程,永久免费使用,Python环境配置和使用指南
这两年被Python初学小白问到最多的问题就是,该用什么代码编辑工具?说实话,我个人是用Jupyter Notebook最多,主要是经常做数据可视化,方便些。但对于初学者来说,PyCharm仍是不二的选择,甚至我建议你只用PyCharm.从当前所有主流Python IDE来看,PyCharm是最适合做Python开发的,特别对新手而言,可以节省很多不必要的时间成本。那么具体如何使用呢?本文假设读者熟悉 Python 开发,且计算机中已安装某个版本的 Python解释器,建议先卸载该版本。教程将使用 Pyth
2025-05-06 11:52:50
4390
1
原创 【报告分享】2024年企业AI大模型应用落地白皮书(附15页文件下载)
深入探讨了AI大模型技术如何助力企业实现智能化升级,并全面分析了其在实际应用中的现状、挑战与未来趋势。本白皮书由亿欧智库权威发布,详细剖析了AI大模型在客户服务、市场营销、供应链管理、产品研发等多个关键领域的应用实践,为企业决策者提供了宝贵的参考和启示。
2025-05-05 15:02:31
925
原创 5000字!全面解读知识蒸馏技术
知识蒸馏(Knowledge Distillation)作为一种有效的模型压缩和加速技术,应运而生。它通过将一个复杂的大模型(称为教师模型,Teacher Model)的知识转移到一个较小的模型(称为学生模型,Student Model)中,使得学生模型在保持较小规模的同时,能够尽可能地接近教师模型的性能。简单来说,知识蒸馏就像是一场 “学习传承” 的过程。教师模型就如同一位知识渊博、经验丰富的老师,经过大量数据的训练,掌握了复杂的数据模式和特征知识。
2025-05-05 14:56:10
1300
原创 LLM大型语言模型脑图 - 应用篇
基于大模型的应用平台是连接用户需求与模型能力的桥梁,旨在通过集成化的开发环境和工具链支持快速构建AI应用。通用AI平台代表特点:提供对话、文本生成、多模态交互等通用功能,支持Web、移动端和API访问。优势:易于上手,适合快速原型开发,覆盖广泛场景(如客服、内容创作)。局限:通用性强但领域深度有限,需额外微调或集成以适配特定行业。开发者工具平台代表:Cursor、Windsurf、VS Code(集成AI插件)特点:专注于编程辅助,支持代码补全、调试、文档生成,集成MCP等协议。优势。
2025-05-04 09:00:00
857
原创 一文读懂《2025人工智能指数报告》,技术跃迁,资本热潮、治理加速,AI正进入新常
斯坦福大学人本人工智能研究院(HAI)发布的《》系统性梳理了过去一年全球AI领域的核心演进轨迹。全文超400页,报告数据涵盖30个国家、60个大型模型、超过10万个指标,是当前理解AI发展趋势的最权威材料之一。2024年,大模型能力再度跃升,多个任务实现,但也暴露出AI在推理稳定性、计划执行等方面的深层次瓶颈。报告揭示的趋势表明,。:领先模型准确率达到59.4%,超过人类的50%基线。:GPT-4在无需工具调用情况下完成率为65.1%,相比人类工程师平均的43.0%显著提升。
2025-05-04 09:00:00
996
原创 图解深度学习 - 数据蒸馏和知识蒸馏
深度学习模型就像是处理数据的筛子,包含一系列越来越精细的数据过滤器(也就是层)。每一层都致力于从数据中捕捉有用的信息,并将这些信息传递给下一层,以便进一步的处理和表示。它通过一系列层层相连的数据过滤器(即层layer),逐步对输入数据进行处理和精炼,从而实现渐进式的数据蒸馏(Data Distillation)。,旨在从原始数据集中提取出更具代表性和有用性的数据子集;知识蒸馏则是一种模型压缩和知识迁移的方法,旨在将大型教师模型中的知识转移到小型学生模型中。
2025-05-03 09:15:00
913
原创 2025-2035年人形机器人发展趋势报告|附53页文件下载
在科技发展的长河中,人形机器人正逐渐从科幻作品中的想象元素,转变为现实生活中日益重要的存在。Abundance360 发布的《2025 - 2035 年人形机器人发展趋势报告》,为我们全面且深入地呈现了这一领域的过去、现在与未来。它不仅是对技术发展的记录,更是对社会经济变革的前瞻性洞察,让我们得以一窥人类与机器人共生的未来图景。
2025-05-03 08:15:00
307
原创 一文彻底搞懂大模型 - Prompt Engineering(提示工程)
Prompt是用户向模型提供的输入,用于引导模型生成特定类型、主题或格式的文本输出。这种输入可以是一个问题、一个描述、一组关键词或上下文信息,它告诉模型用户希望得到的输出类型和内容。提示工程(Prompt Engineering)涉及到如何设计、优化和管理这些Prompt,以确保AI模型能够准确、高效地执行用户的指令。
2025-05-02 09:00:00
954
原创 浙江大学《大模型:从单词接龙到行业落地》(附下载链接)
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。大模型的起源可以追溯到早期的人工智能概念——图灵测试。
2025-05-02 08:30:00
692
原创 阿里云:人人懂AI之从机器学习到大模型 | 如何把AI技术融入到产品
AI 以极快的速度融入到每个人的日常,影响工作、学习、生活等方方面面。云计算、AI 等浪潮下,IT 从业者面临新挑战,也迎来新机遇。未来,AI 预计会成为像计算机语言一样的基础 IT 技能。
2025-05-01 10:30:00
329
原创 一文彻底搞懂大模型 - Agent(智能体)
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。Agent是能够模拟独立思考过程,灵活调用各类工具,逐步达成预设目标。
2025-05-01 08:45:00
733
原创 最全解析!通义千问Qwen3系列模型你想知道的都在这里
近期,阿里巴巴通义千问Qwen3系列大型语言模型正式发布并开源。此次发布包含了2款采用混合推理(Mixture-of-Experts, MoE)架构和6款稠密(Dense)架构的模型,这些模型在代码、数学、通用能力等基准测试中表现出色,与顶级模型相比展现出极具竞争力的结果。Qwen3系列涵盖了从十亿级到千亿级参数规模的模型,满足不同应用场景的需求。主要分为MoE架构和Dense架构两种类型。MoE模型通过在推理时仅激活部分专家(参数子集)来提高效率,能在较低的计算成本下实现高性能。
2025-04-30 11:31:08
943
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人