- 博客(749)
- 收藏
- 关注

原创 在个人电脑上运行Llama 3 70B大规模模型指南
随着人工智能和机器学习技术的迅猛发展,像Llama 3 70B这样的庞大语言模型已经成为了研究、开发和应用中的重要工具。这篇文章将详细介绍如何在个人电脑上运行Llama 3 70B大模型,并涵盖硬件要求、软件环境配置、安装步骤、运行示例和常见问题的解决方案。虽然运行这样一个大规模的模型在性能上有限制,但对于实验和学习非常有帮助。
2024-06-15 10:35:11
7547

原创 2024!国内AI大模型平台哪家强?全方面测评来了
这篇仅是开坑哈,后面会持续更新的~主旨就是想要在滚滚浪潮中帮助AI开发者发现、汇聚到简单、好用的AI大模型平台&开发者社区上来,共建国内繁荣AIGC生态!!有些规模太小、不好用、吃相太难看(没几个模型就要走付费变现路子的)的平台我就先不放上来啦。
2024-06-05 17:14:02
7469

原创 如何学习训练大模型——100条建议(附详细说明)_如何训练自己的大模型
通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步积累经验,最终能够处理大模型和复杂任务。分享您的研究成果和代码,以获得反馈和建立声誉。
2024-04-17 11:56:47
7056

原创 AI 入门,从零搭建完整 AI 开发环境,并写出第一个 AI 应用
在本文中,我们从零开始,一步步搭建了一个完整的AI开发环境,并创建了一个简单的AI应用。您学习了如何安装Python、Anaconda、TensorFlow,以及如何使用Jupyter Notebook进行开发。通过这个简单的手写数字识别应用,您不仅学习了AI的基本概念,还亲身体验了AI的应用。AI是一个广阔而充满机遇的领域,希望这个教程能够激发您继续深入学习和探索AI的兴趣。
2024-04-10 11:02:43
10716
1

原创 国内超大型智能算力中心建设白皮书 2024
智算中心建设通过领先的体系架构设计,以算力基建化为主体、以算法基建化为引领、以服务智件化为依托,以设施绿色化为支撑,从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构(一)总体架构图8 智算中心总体架构智能算力中心建设白皮书,重点围绕基础、支撑、功能和目标四大部分,创新性地提出了智算中心总体架构。其中,基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构;支撑部分围绕智算中心算力生产、聚合、调度、释放的作业逻辑展开;功能部分提供算力生产供应、数据开放共享、智能生态建设和产业创
2024-04-08 15:07:31
9856
1
原创 大模型入门指南 - Prompt Engineering:小白也能看懂的“提示词工程”全解析
当用户下达“随便弄杯饮品”的模糊指令,大模型可能会创造出板蓝根咖啡这样令人咋舌的“创意搭配”;而一旦给出“少冰三分糖、加脆波波的杨枝甘露”这类精确需求,它便能瞬间化身专业调饮师,奉上标准出品。这种天壤之别的结果,核心在于是否通过提示词构建起“人类需求”与“机器语言”之间的精准沟通桥梁。这就好比走进理发店,简单一句“剪短些”可能换来参差不齐的尴尬发型,而“发尾修剪3厘米,保留厚度,刘海打造空气感”的详细要求,才能确保造型理想。大模型运行逻辑亦是如此——缺乏细节的笼统指令往往引发执行偏差,唯有结构化、清晰
2025-05-14 14:12:56
539
原创 Java开发必备!在Spring AI接入DeepSeek,真的香
我这人有个习惯,一碰到新工具就手痒,总想深入研究一番,特别是那些能大幅提升开发效率、减少代码量的实用工具。最近负责公司的一个小型项目,需要集成AI聊天功能。起初,我计划使用OpenAI接口快速实现功能,但领导却提出:“优先选用国产方案,尽量减少对国外技术的依赖。”考虑到当前国产大模型发展势头迅猛,我最终选择了DeepSeek作为项目的AI支持。然而,真正开始着手开发时,难题接踵而至:DeepSeek的API与Java原生环境存在兼容性问题,该如何实现集成? 毕竟这是一个Spring Boot项目,不同于
2025-05-14 14:04:20
346
原创 大模型入门指南 - MoE:小白也能看懂的“模型架构”全解析
MoE秉持“分而治之”的理念,为突破大模型在参数规模与计算效率方面的瓶颈开辟了全新路径。经过国产模型DeepSeekMoE、Qwen-2.5 Max,以及国际标杆GPT-4等实践检验,MoE已然成为构建下一代大模型的关键架构。
2025-05-13 14:29:25
366
原创 谁适合转行做 AI 产品经理?一篇文章帮你彻底弄懂!
当 AI 技术像潮水般席卷各行业,AI 产品经理这一岗位成为众多职场人眼中的 “香饽饽”。从技术专家到传统行业从业者,都在考虑向这个新兴领域转型。但并非所有人都适合这条赛道,接下来就带你深入剖析,究竟谁能在 AI 产品经理的岗位上发光发热。
2025-05-13 13:57:15
584
原创 北京航空航天大学:2025工业大模型白皮书(免费下载)
在智能化浪潮中,制造业正经历着前所未有的变革。《2025工业大模型白皮书》 (文末有PPT免费获取方式)带来了一束新的光芒。这份凝聚了北航与蚂蚁工场等顶尖团队心血的报告,是工业智能化的启明星,照亮了前行的道路。书中详尽的分析与洞察,层层剖析了工业大模型的现状与未来,不仅深入探讨了其独特的技术体系,更是精准点出了当前面临的关键挑战。这不仅是一份对工业大模型的全面解读,更是献给所有致力于推动工业进步人士的珍贵指南。它将激发我们对未来无限可能的想象,引领我们踏入一个全新的智能制造时代。
2025-05-12 14:35:05
413
原创 Qwen2.5-Omni-3B:支持视频、音频、图像和文本的全能AI,可在本地运行
Qwen2.5-Omni-3B是阿里云推出的全能AI模型。它能同时处理视频、音频、图像和文本。只有3B参数,却能在本地运行强大的多模态功能。近日,已经在Hugging Face上发布。它是小型多模态AI系统的重要突破。
2025-05-12 14:31:41
1192
原创 上交2025最新-《动手学大模型》实战教程及ppt分享!
《动手学大模型》系列编程实践教程,由上海交通大学2024年春季《人工智能安全技术》课程(NIS3353)讲义拓展而来(教师:张倬胜),旨在提供大模型相关的入门编程参考。通过简单实践,帮助同学快速入门大模型,更好地开展课程设计或学术研究。
2025-05-10 13:55:08
385
原创 Dify+MCP 组合拳:彻底根治 Excel 上传知识库回答数据不准的难题!
MCP结合数据库的方案为Dify等知识库应用提供了高效、精准的结构化数据检索能力,显著提升了数据查询的准确性和灵活性,弥补了RAG的检索精度上的不足。但是,这一方案也是有缺点的,与RAG每次只检索相关文本片段不同,MCP+数据库会真正执行SQL查询,若一次查询数据量过大,会消耗大量Token,甚至可能导致MCP客户端卡死。在实际应用中,我们应该将两种技术结合使用,取长补短,灵活处理自己的业务场景。
2025-05-10 13:53:02
881
原创 RAG技术全景解读:从原理到实践的学习指南
是一套融合检索技术与生成式大模型的创新技术架构。它的运作原理是为诸如GPT-4、Claude等大语言模型配备一个“知识补给库”,在模型生成内容前,先从外部知识库中调取相关信息,以此来有效规避大模型常见的。
2025-05-09 14:24:26
884
原创 《2025“人工智能+”行业发展蓝皮书》亮点解读:AI如何重塑全球产业格局?
2025“人工智能+”行业发展蓝皮书》由上海交大泰安经管学院发布,全面梳理了全球人工智能大模型发展的技术演进、产业趋势及其对制造、能源、金融、材料、医疗等多个关键行业的深层次赋能路径。报告指出,AI正从单一技术突破转向支撑产业系统性重构,成为推动新质生产力的重要驱动器。
2025-05-09 14:12:39
415
原创 厦门大学:大模型工具177页实战手册(教你用明白、用扎实,纯干货)
这份手册的价值不在于“让你用上大模型”,而在于“教你用明白、用扎实”,它是当前中文语境下难得一见的实操型内容。我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍2️⃣ 行业重构:金融、医疗、教育正在被AI重塑,不用大模型的公司3年内必淘汰3️⃣ 零门槛上车:90%的进阶技巧不需写代码!
2025-05-08 14:10:47
414
原创 小白学大模型:从零实现 LLM语言模型
在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。本文将为你提供一个简单直接的方法,从下载数据到生成文本,带你一步步构建大院模型。在开始训练语言模型之前,你需要对面向对象编程(OOP)、神经网络(NN)和 PyTorch 有基本的了解。训练语言模型需要强大的计算资源,尤其是 GPU。不同的 GPU 在内存容量和计算能力上有所不同,适合不同规模的模型训练。
2025-05-08 14:00:56
636
原创 什么是大语言模型(LLM)?一文带你看懂大语言模型!
在人工智能快速发展的今天,大语言模型(Large Language Model,LLM)已然成为人们热议的焦点。从智能聊天机器人到文本创作助手,大语言模型的身影无处不在。那么,究竟什么是大语言模型?它又是如何实现这些神奇功能的?接下来,我们用 5 分钟时间一探究竟。
2025-05-07 13:53:59
1012
原创 2025中国人工智能行业大模型应用实践与展望报告(免费下载)
在当今数字化浪潮中,人工智能大模型正以磅礴之势重塑各行业格局,成为推动经济社会发展的重要引擎。从全球视角来看,人工智能大模型发展呈现出多维度显著趋势。在技术层面,多模态融合持续深入。早期单一模态大模型逐渐向融合文本、图像、声音等多形式的多模态大模型转变,未来将实现更深度的模态信息融合与自由交互。例如,一些多模态大模型能够同时理解图片中的文字内容和整体图像信息,为图像标注、内容审核等场景提供更精准的解决方案。
2025-05-06 11:22:50
1062
原创 大模型入门必看指南:从小白到入门
大模型是AI领域的“超级工具”,用好了能改变生活,但需要理性看待。入门从“会用”开始,逐步深入技术原理,保持好奇,持续学习!
2025-05-06 11:17:08
953
原创 【大模型面试必看】面试迷茫?一文看懂大模型面试项目之open_llama_3b + Alpaca + 8-bit + LoRA
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。所以我综合了大模型的所有知识点,给大家带来一套。
2025-05-05 14:33:38
1035
原创 RAG是什么,一文看懂什么是RAG
检索增强生成(RAG)是一种用于构建大型语言模型(LLM)驱动型应用的技术。它借助外部知识源,为大型语言模型提供相关背景信息,从而减少幻觉现象。就好比给 LLM 配备了一个小型的“资料库”,当用户提出问题时,系统会在资料库中查找相关内容并提供给 LLM,以帮助其生成更准确的回答。基本的 RAG 流程包括检索组件(通常由嵌入模型和向量数据库组成)和生成组件(大型语言模型)。在推理阶段,用户问题用于在已索引的文档上执行相似性搜索,检索出与问题最相似的文档,并为大型语言模型提供额外的背景信息。
2025-05-05 14:26:09
1755
原创 【大模型入门必看】认真啃完这些书,一条线速通大模型(附PDF)
说句实在的,很多人以为学大模型就是搞点提示词、调个 API,就能搞定一切。但真想“弄懂它”,甚至“做出点东西”来,不啃几本靠谱的书,真的不行。直到我静下心认真啃完这些书,才发现——原来很多问题,书里早就帮你解答了。这几本书是一路上踩坑总结的「大模型学习黄金书单」,从编程入门,到深度学习基础,再到 LLM 原理、落地应用,完整一条线,不忽悠、不烧香,适合想认真搞事的朋友!别的不说,谁学 Python 没啃过“蟒蛇书”?Amazon、京东编程类榜首,影响 250 万读者,可不是吹的。📌 为什么推荐它?
2025-05-04 08:15:00
729
原创 前端 x AI:从了解提示工程、RAG和微调开始
经过上面的介绍,相信大家对提示工程、RAG、微调有了一个初步的认知。我们在实际的工作中,尽量从提示工程开始,再用RAG,最后才考虑微调,不要一开始就要做微调,这个在工程中是不可取的。随着大模型的升级迭代,大模型的能力是会越来越强的,通过提示工程往往可以解决大部分问题了。
2025-05-04 08:00:00
792
原创 前端 x AI:基于Ollama、DeepSeek、Chroma、LangChain搭建AI应用开发框架
Ollama 是一款开源框架,专注于在本地环境部署和运行 LLM。它通过简化模型管理流程和优化硬件资源利用,为开发者、企业及研究人员提供高效便捷的本地化 AI 解决方案。Ollama 内置多种模型支持,包括 Llama 2、Mistral、DeepSeek 等,用户可根据需求选择不同参数规模的模型(如 8B、70B 等)。DeepSeek R1 是一款利用思维链(CoT)来提高回复质量的推理模型。
2025-05-03 08:15:00
751
1
原创 清华大学 | 104页《DeepSeek:从入门到精通》,人人必备的Ai手册!(附下载方法)
DeepSeek:从入门到精通》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心撰写的一份专业文档。该文档以通俗易懂的方式,全面介绍了DeepSeek的使用方法,为用户提供了极具价值的指导。这份文档内容丰富,篇幅长达104页,涵盖了众多实用技巧。从避免AI幻觉的小窍门,到设计出色提示语的秘籍,每一页都凝聚着干货知识,让用户能够直接上手操作,快速掌握DeepSeek的精髓。
2025-05-03 08:15:00
1511
原创 《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码
**这是一本旨在帮助读者深入理解深度学习原理并掌握Python编程实践的入门指南。****本书全面介绍了深度学习的基本概念、常用模型和算法,** 并结合**Python编程语言进行实现,** 使读者能够从理论到实践,逐步掌握深度学习的核心知识和技能。**本书首先介绍了深度学习的基本概念,包括神经网络的结构、前向传播和反向传播等基本原理,为读者打下理论基础。****内容展示:**
2025-05-02 09:30:00
308
原创 零基础吗,手把手教你基于 DeepSeek + Chroma + LangChain 开发一个简单 RAG 系统
那么,今天我们基于这一套全栈 AI 应用开发框架开发一个简单的 RAG 系统。
2025-05-02 08:00:00
818
原创 RAG系列:一文让你由浅到深搞懂RAG实现
RAG(检索增强生成)是一种结合检索与生成的技术,通过实时检索外部知识库中的信息,动态增强大语言模型(LLM)的生成能力,是用于解决幻觉问题、知识时效问题、超长文本问题等各种大模型本身制约或不足的必要技术。RAG核心流程包括:对用户问题进行改写、扩写和重构,让用户问题更利于检索;从外部知识库(如企业文档、行业数据库)中筛选与用户问题相关的片段,并将检索结果与原始问题整合为增强提示词,输入给LLM;LLM基于增强后的提示词,生成精准、可靠的答案。RAG具有以下优点:实时性。
2025-05-01 12:00:00
1899
原创 2024年中国大模型行业应用优秀案例白皮书
随着人工智能技术的飞速发展,AI大模型在各行业的应用日益广泛,成为推动产业智能化和优化业务流程的重要力量。然而,企业用户对大模型的专业性、安全性、稳定性和持续性提出了更高要求。为了帮助企业及用户了解大模型在各行业的应用情况、厂商表现及优秀实践,本文深度分析了多个行业的大模型应用案例。报告涵盖了金融、能源、医疗健康、教育、科学、高端制造、互联网等多个行业,旨在全面展示大模型在各领域的应用与发展情况,并探讨了企业在选择和应用大模型时所需的核心能力和竞争力。
2025-05-01 09:00:00
414
原创 产品经理到底要不要转行 AGI?
作为一个非算法出身的AI产品经理,转行之前我也有过纠结和顾虑,怕自己“干不了”。在做了3年AI产品之后,我的结论是:现如今大模型跑步落地的时期,存在很多信息差,非常适合“乱入”。
2025-04-30 11:19:56
1015
原创 RAG是什么?RAG综述,看完不迷路!
RAG(Retrieval Augmented Generation,检索增强生成 )方法是指结合了基于检索的模型和生成模型的能力,以提高生成文本的质量和相关性。该方法是Meta在2020年发表的文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出的,该方法让LM(Language Model,语言模型)能够获取内化知识之外的信息,并允许LM在专业知识库的基础上,以更准确的方式回答问题。
2025-04-30 11:16:17
736
原创 大厂AI产品岗面试,无非就是问这些...
在之前做xxx产品的迭代方案时,我基本上会这样做。首先,在迭代产品的大部分情况下,我会优先去考虑用户价值,比如把下期迭代的功能清单在种子用户群可以反馈下,粗颗粒度地了解核心用户对迭代的喜好程度,再去考虑商业价值,因为始终记住一一有了用户后,用户产生的价值远大于商业价值。在迭代周期上,我会考虑快速迭代——产品一定要保证双周一个版本(紧急版本可以发布,部分功能可以长时间内测,有效果后,就可以上线),一个月基本上迭代一次。
2025-04-29 14:27:52
941
原创 对标OpenAI o1、DS-R1,1分钟速览阿里开源Qwen3核心看点!
就在刚刚(4.29凌晨),备受关注的Qwen3系列模型产品重磅发布!8款细分产品、包括两个MOE模型产品、六款Dense模型产品,其中旗舰产品 Qwen3-235B-A22B属于MOE模型,拥有235B的参数量,实际推理过程中激活其中22B参数,本文汇总了Qwen3的核心看点,一起速览!
2025-04-29 14:13:59
561
原创 Dify本地化部署:系统要求、依赖安装、源码获取、环境配置、服务启动及常见问题解决
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。
2025-04-28 13:58:45
1412
原创 初学者如何对大模型进行微调?
大模型无疑是AI领域这两年最靓的仔,无论是陪人聊天吹牛,还是被科学家用于各种AI4Science研究;无论是生成一些手指数目不对的涩图,还是被用于生成公司logo、电影海报,总之,每一次“事关”大模型的新闻,总会引起大家的广泛关注和讨论。这其中,在已有大模型的基础上,针对某一领域或用途进行微调,使其在特定任务上具有更为出色的表现,无疑是当前大模型商业化应用的重要方向。
2025-04-28 11:52:34
1060
原创 中山大学-2025从技术突破到场景落地:大模型发展图谱与DeepSeek创新应用报告(附PDF下载)
2024年3月5日,李强总理在全国人大报告中首提“人工智能+”行动,标志着AI技术正式从实验室走向产业革命的深水区。当摩尔定律趋缓、算力瓶颈逼近时,大模型技术却以指数级增长撕开了技术迭代的新口子。从生成式AI的爆发到DeepSeek的横空出世,人工智能正在经历从“工具”到“智慧体”的范式转移。今天,我们就来拆解这份《中山大学2025大模型发展图谱》背后的硬核逻辑——当技术突破撞上场景落地,DeepSeek究竟如何改写游戏规则?但更值得深思的是,当AI开始自我迭代,人类的角色将如何转变?
2025-04-27 14:20:25
954
原创 零门槛!手把手教你用VS Code + DeepSeek 免费玩转AI编程!
以上就是我们分享的全部内容,大模型真正造福了我们开发者,即使你不会代码,也可以利用DeepSeek+Vs Code+Cline+Continue让你的想法变为现实!还不赶快动手操作起来吧~我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍。
2025-04-27 14:17:06
1482
原创 腾讯云:DeepSeek产品技术方案分享(免费下载)
当大模型技术步入深水区,腾讯云与DeepSeek联手发布行业首个全栈国产化技术方案,以“”三驾马车,精准破解大模型落地“”的三重困局。该方案(,不仅将模型推理效率提升300%、知识库构建周期压缩70%,更关键的是打造了从模型训练到产业落地的全自主技术闭环,为千行百业提供可复制的智能化升级路径。这不仅是技术的突围,更是国产大模型工业化的里程碑。基于知识引擎构建零代码开发平台,集成DeepSeek满血版模型与实时搜索增强模块。
2025-04-25 14:14:43
1054
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人