- 博客(790)
- 收藏
- 关注

原创 100道高频大模型面试题,看我是如何手撕面试官 脚踢hr
提供一百道面试题并保证每一道题目的详细解答达到一千字是不太现实的,因为这将会是一个非常庞大的文档。不过,我可以为你提供一系列精心挑选的大模型相关面试题目,并简要说明每个问题的重点和考察方向,这样可以帮助你准备面试。大模型面试题集总结以上这些面试题目涵盖了从基础概念到高级技术的各个方面,对于准备大模型相关职位的面试非常有帮助。建议在准备过程中,不仅要熟悉这些问题的答案,还要尝试自己动手实践,这样才能真正掌握所学知识。希望这份面试题集能帮助你在面试中脱颖而出!
2024-08-16 16:06:29
1528

原创 跨越边界:我在转型AI产品经理的一年里所积累的成长与感悟
不知不觉,已经挂着AI产品经理的title过了一年多,盘点后竟然发现,这一年中居然从0到1做了4款AI应用产品,涉及内容、营销销售、私域运营等方向,忙碌而充实。今天就结合自己这一年多的AI转型实践,和大家分享下我关于AI产品经理的一些总结和思考。在这一年多的转型旅程中,我从一名传统产品经理成长为AI产品经理,这个过程充满了挑战与收获:知识体系的重构我系统地学习了机器学习、深度学习、自然语言处理等AI基础课程,弥补了技术知识的空白。
2024-08-02 18:07:37
2023

原创 深入探究文档解析技术,助力大模型训练与应用的创新发展
探索文档解析技术是推动大模型训练与应用的重要一环。随着信息的爆炸式增长,文档数据成为了重要的数据来源之一,这些数据以多种形式存在,包括结构化数据、非结构化文本和图像等。因此,有效地解析和理解这些文档数据对于提升大模型性能与拓展大模型应用至关重要。在此背景下,大模型训练与应用需要依赖先进的文档解析技术来处理复杂的文档数据。
2024-07-19 11:41:07
1942

原创 初识LangChain的快速入门指南
LangServe可以帮助开发人员将LangChain应用程序部署为REST API。使用LangChain时不是必定使用LangServe。安装langserve。
2024-06-29 20:56:14
1665

原创 从零开始认识大模型,入行必读!
大模型,顾名思义,就是具有庞大参数和复杂结构的机器学习模型。它能够处理海量的数据,从中提取出有价值的信息,为我们提供决策支持。与传统的机器学习模型相比,大模型具有更高的准确性、更强的泛化能力和更广泛的应用场景。
2024-06-24 13:47:24
2117
原创 【大模型学习路线】2025最新大模型技术学习路线:从入门到精通,一篇文章全掌握!
理论其实就是一套描述和解决问题的方法论,只不过不同的技术有不同的方法,也就是理论。理论的发展有两种方式,一种是基于实践检验结果总结出来的经验;二种是以严谨的科学理论推导出逻辑自洽的解决某个问题的方法。比如说,火是人类生存和进化的重要条件之一,而在远古时期人类对于火的认知还比较浅显,因此那时关于火的理论也比较基础,比如它可以取暖,可以烤熟食物等;这就是基于经验的理论基础。。
2025-03-15 16:48:25
730
原创 Obsidian Copilot+Ollama:打造智能本地知识库,Obsidian从此更强大!
Obsidian Copilot 是一款为 Obsidian 笔记软件设计的 AI 助手插件,它将 AI 技术(如 OpenAI 的 GPT 模型)无缝集成到 Obsidian 的笔记工作流中,为用户提供智能化的写作、知识管理和思考辅助功能。通过 Obsidian Copilot,用户可以在笔记中直接与 AI 进行交互,从而提升笔记的整理效率、写作质量和知识探索能力。
2025-03-15 16:46:26
397
原创 RAG实践教程:Ollama+RagFlow强强联合,本地知识库部署无忧!
本文我们介绍另一种实现方式:利用 Ollama+RagFlow 来实现,其中 Ollama 中使用的模型仍然是Qwen2我们再来回顾一下 RAG 常见的应用架构。
2025-03-15 16:45:04
381
原创 告别手动整理!云端满血版DeepSeek助你轻松构建个人知识库
最新刚结束上一次技术年终总结创作的领奖环节,最近也在公司内部推行基于 DeepSeek 的内部知识库,上了腾讯云,发现点进去我才发现,腾讯云最近就上新了这个带有阳光普照奖的活动!点进来一看,原来不差钱的腾讯云部署了满血版DeepSeekV3+R1:并且推出了自研的大模型知识引擎,再加持联网搜索buff,赋能个人更便捷开发RAG知识库和工作流应用:看到这炫酷的产品落地页,我对其使用效果更加期待了!
2025-03-15 16:43:28
420
原创 Qwen2.5-0.5B siglip模型:预训练与微调实验全解析
通过在 Qwen2.5-0.5B 和 siglip 之间训练一个中间层构造 VLM。作者提到首次微调时,只冻结了视觉模型的参数,导致阶梯状的 loss 曲线,即发生过拟合。应冻结文本和视觉模型的全部参数,只训练中间层。
2025-03-15 16:41:24
544
原创 这可能会是你见过最全的大模型学习路线(2025最新)大语言模型(LLM)入门学习路线图
Github项目上有一个[大语言模型学习路线笔记],它全面涵盖了大语言模型的所需的基础知识学习,LLM前沿算法和架构,以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识,并推荐了一系列优质的学习视频和博客,旨在帮助大家系统性地掌握大型语言模型的相关技术。
2025-03-14 21:03:33
850
原创 DeepSeek R1 671B完整版本地部署教程:全面解析,轻松上手!
过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。虽然网络版和 APP 版已经足够好用,但把模型部署到本地,才能真正实现独家定制,让 DeepSeek R1 的深度思考「以你为主,为你所用」。关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。
2025-03-14 21:00:59
453
原创 大模型Agent智能体深度解析:原理与案例全面理解!
大模型 Agent,作为一种人工智能体,是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体。简而言之,它是构建于大模型之上的计算机程序,能够模拟独立思考过程,灵活调用各类工具,逐步达成预设目标的智能存在。Agent 是 AI 大模型应用的主要新形态,在技术架构范式也发生了很大的变化,从面向过程的架构变成了面向目标架构。
2025-03-14 20:57:38
820
原创 大模型入门指南:一篇文章带你全面了解大模型基本概念!
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2025-03-14 20:54:54
597
原创 2025年医疗医药领域AI大模型十大应用案例:重塑产业新生态,引领行业变革!
在2024全球数字经济大会人工智能专题论坛中发布了“2024人工智能大模型场景应用典型案例”。本文整理了医疗医药领域发布的10个案例,通过展示人工智能大模型在医疗医药领域的落地应用,帮助解决实际问题,推动行业发展。在患者招募场景,医渡科技利用大数据+大模型技术打造智能筛选系统,可以为肿瘤类项目平均节省88.5%人工筛查成本,非肿瘤类项目平均节省69.8%人工筛查成本。该药物临床试验加速平台已在北京大学肿瘤医院完成了系统部署及推广工作,发挥实际效果。
2025-03-14 20:52:35
622
原创 《大模型应用开发极简入门》:大模型初学者必备,开启你的大模型开发之旅!
大家好,今天给大家推荐一本大模型应用开发入门书籍《大模型应用开发极简入门》,本书对很多AI概念做了讲解和说明!朋友们如果有需要 《》,。
2025-03-13 22:18:44
776
原创 2025医疗AI新篇章:生成式AI引领革命,深度解读医疗人工智能的未来发展【附报告PDF】
导读《2024年医疗人工智能研究报告》由蛋壳研究院发布,深入探讨了医疗人工智能在2024年的发展现状与未来趋势。报告指出,随着大语言模型和生成式AI技术的快速发展,医疗领域的多个场景如互联网医疗、医学影像、新药研发等正经历重塑,释放出前所未有的价值。然而,同时强调,在融资形势严峻的背景下,医疗AI企业必须全面考量场景、技术、风控、商业化等多方面因素,以实现决策的精准性。研究核心聚焦于“场景”与“产品”,通过分析医院、药企、械企的供需逻辑和实战案例,为AI企业在布局、选品、研发、商业化方面提供参考建议。
2025-03-13 22:16:13
904
原创 本文会手把手教你如何部署本地大模型以及搭建个人知识库,使用到的工具和软件有
本文会手把手教你如何部署本地大模型以及搭建个人知识库,使用到的工具和软件有本文主要分享三点读完本文,你会学习到官方下载地址:ollama.com/download当安ollama之后,我们可以通过访问如下链接来判断ollama是否安装成功当安装完成ollama之后,我们就可以在命令行中运行如下命令既可以其中[model name]就是你想运行的本地大模型的名称,如果你不知道应该选择哪个模型,可以通过model library进行查看。这里我们选择llama2大模型:llama2考虑到我机器的配置以及不同
2025-03-13 22:14:02
552
原创 2025最新大模型LLM学习路线图来了!全站首发!
ChatGPT的出现在全球掀起了AI大模型的浪潮,2023年可以被称为AI元年,AI大模型以一种野蛮的方式,闯入你我的生活之中。从问答对话到辅助编程,从图画解析到自主创作,AI所展现出来的能力,超出了多数人的预料,让不少人惊呼:“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。
2025-03-12 20:14:09
795
原创 AI智能体(AI Agent)发展动态:2024年总结与2025年展望!
人工智能(AI)的快速发展引发了各行业的变革性转变。在 AI 的众多进步中,智能体作为创新的基石脱颖而出,重塑了行业格局,提升了用户体验,并将自动化推向了新的高度。这些自主运行的虚拟机已经在客户服务、医疗保健、金融甚至娱乐等领域占据了一席之地。那么,人工智能智能体的未来会是怎样的呢?在本文中,我们将探讨 2025 年及未来几年人工智能智能体的趋势和预测。人工智能智能体是旨在执行任务、做出决策并与人类或其他系统进行交互的自主系统。它们形式多样,从虚拟助手到协调物流或金融运营的高级多智能体系统不一而足。
2025-03-12 20:11:43
777
原创 大模型深度解析:定义、特点、应用场景与行业前景全掌握!
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2025-03-12 20:08:37
1022
原创 99行代码!教会你用Doris+DeepSeek实现AI舆情分析
随着Doris和大模型技术的进步,未来的舆情分析系统将更加智能化。我们可以期待这些趋势:1️⃣ 多模态分析:不仅分析文字,还能识别图片、视频中的情绪和内容2️⃣ 预测性分析:不只是被动应对,而是预测可能出现的舆情风险3️⃣ 个性化回应:根据不同用户的特点,生成个性化的回应策略舆情分析不再是简单的数据统计,而是企业和组织必备的社会雷达。Doris+DeepSeek的组合将成为这个领域的有力工具。AI赋能舆情分析,让危机变成机遇。你的99行代码,可能就是阻挡舆情风暴的最后一道防线。
2025-03-12 20:04:06
716
原创 OpenManus+QwQ32B 本地部署
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-12 20:01:32
1131
原创 如果你是一个35岁的程序员,想要转行进入大模型领域,可以采取以下步骤来准备和规划
首先,你需要掌握一些基础知识,如机器学习、深度学习、神经网络等。可以通过在线课程、书籍、研讨会等方式进行学习。例如,你可以学习TensorFlow、PyTorch等深度学习框架。:理论知识学习后,通过实际操作来加深理解。你可以尝试自己实现一些简单的模型,或者在Kaggle等平台上参加数据科学竞赛,通过实际项目来提升自己的技能。:了解大模型领域的最新研究动态和应用场景。关注顶级会议(如NIPS、ICML、NeurIPS等)和顶级期刊,阅读相关论文,了解当前的研究热点和未来发展趋势。
2025-03-11 16:12:31
1323
原创 人工智能大模型在舆情分析中的应用与实战指南!
舆情分析是一种利用人工智能和大数据技术对社交媒体、新闻报道、论坛讨论等多种信息源进行分析的方法,以了解公众对某个话题的情感、态度和观点。随着人工智能技术的发展,尤其是大模型的出现,舆情分析的精度和效率得到了显著提高。本文将介绍大模型在舆情分析中的应用,包括核心概念、算法原理、具体实例和未来发展趋势。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
2025-03-11 16:09:25
307
原创 deepseek接入办公软件(wps,office通用)最完整教程
在word中,一键生成大纲、扩展内容、优化完善内容在ppt中,一键进行内容总结实现上面视频的功能一点都不难,只需以下几步就可完整,后面有详细教程1、准备office办公软件2、注册deepseek的API,获取apikey3、在word中导入VBA模块并修改apikey4、配置功能菜单5、使用测试如果你是的电脑安装的是office,只要是2016以上版本即可,可跳过此章节。
2025-03-11 16:07:49
1016
原创 【清华大学第七版】deepseek赋能家庭教育的实操案例(批改作文+辅助语文/数学/科学学习+制定学习计划)
近日,清华大学发布了《使用deepseek赋能家庭教育》,这份资料干货满满,足足有56页。它深入探讨了DeepSeek在家庭教育里的多元应用,涵盖多个关键教育场景。在学习辅助方面,DeepSeek能助力孩子修改作文,让语句更通顺、立意更深刻;还能依据孩子的学习情况,量身定制学习计划,还能帮助家长辅导数学、语文、英语、科学的学科学习。除了学业,资料还聚焦孩子的成长软实力,介绍如何借助AI进行情绪管理,培养高效沟通技巧,让孩子能更好地应对学习与生活的压力,建立良好的人际关系。
2025-03-11 16:05:24
483
原创 DeepSeek R1成功迁移到视觉领域!全面开源!
今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。论文地址: https://arxiv.org/abs/2503.01785代码地址: https://github.com/Liuziyu77/Visual-RFT。
2025-03-11 16:04:16
820
1
原创 大模型时代的产品经理:为何必须学习,未来人人都是产品经理?_大模型产品经理
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
2025-03-10 17:03:11
1335
原创 AI智能体深度解析:定义、关键特性与实现方法,一篇文章全掌握!
AI 智能体(Agent)是一种自主运行的人工智能系统,能够感知环境、做出决策并执行特定任务。它通常以任务驱动为核心,结合人工智能技术,实现高效的交互和智能化的服务。
2025-03-10 16:55:30
1141
原创 大模型RAG:原理、应用与未来趋势,一篇文章全了解!
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2025-03-10 16:47:14
1051
原创 Manus 使用的工具和提示词被曝光,安全令人担忧
2025年3月10日,X平台用户@jian发布帖子称通过简单的自然语言指令成功获取Manus的系统文件(路径:/opt/.manus/),暴露其沙箱运行时代码、工具链及完整提示词框架。此次泄露不仅揭示其基于Claude Sonnet模型的底层架构,更暴露出严重的安全设计缺陷,引发行业对AI自动化工具安全性的深度担忧。
2025-03-10 16:44:39
1230
原创 企业如何选择适合自己的大模型
企业可以使用多种方法来从 LLM 获得所需的结果。在生产中部署 LLM 时,您可以选择不同类型的模型,这些模型具有不同的训练程度,复杂度、成本和质量水平也各不相同。以下是一些不同的方法:提示工程并附加上下文。这样做的目的是在提示时提供足够的上下文,以确保您获得所需的响应。检索增强生成 (RAG)。例如,您的数据可能存在于数据库或 Web 端点中,为了确保在提示时包含此数据或其子集,您可以获取相关数据并将其作为用户提示的一部分。微调模型。
2025-03-10 16:43:22
597
原创 2025 AI大模型学习全景图:从入门到精通的系统性技术路径与资源索引
自学AI大模型需要扎实的基础知识、系统的学习路线和持续的实践与探索。希望这条学习路线能为新手小白们提供一个清晰的方向,帮助大家更好地进入和发展在AI大模型领域。祝大家学习顺利,早日成为AI领域的专家!。
2025-03-09 18:44:50
1029
原创 大模型本地部署超简单教程:一分钟快速完成,开启AI智能新体验!
首先打开ollama官网 https://ollama.com这里使用的是windows,直接选择下载即可文件下载好后之间打开点击安装即可默认会安装到c盘,请预先给c盘足够的空间来保证环境安装和模型下载所需空间充足安装完成后打开windows PowerShell可以输入ollama来验证是否安装成功或者变量配置是否有问题这里以wizardlm2模型为例,我们只需要在命令行中输入ollama run wizardlm2:7b即可等待模型下载完毕即可纯净系统启动可能存在vc运行库缺少问题。
2025-03-09 18:40:45
621
原创 阿里QwQ-32B推理模型测评与使用教程:全方位解析,轻松上手!
总体来说,这次通义开源的 QwQ-32B 推理模型还是很不错的:第一是 32B 小参数模型性能与超大参数的推理模型性能不相上下,做到了在保证性能的同时降低对计算资源的依赖,从而实现更加环保、可持续的AI技术发展;第二是响应速度也是相当不错的,不会遇到服务器繁忙的情况;第三是它支持 function call 功能,这一点对于模型开发来说有多重要就不必多说了。如今,距离 o1 模型发布不过五个月,推理模型领域已经迎来了百花齐放的新局面。
2025-03-09 18:38:41
1221
原创 厦门大学|1-3合集火了,共413页太全太牛了 ,《DeepSeek大模型及其企业应用》全面剖析企业AI转型路径,一定不能错过!
DeepSeek大模型及其企业应用》由厦门大学大数据教学团队林子雨副教授领衔编写,是一份面向企业人员的实用指南。该报告是系列报告的第三篇,系统梳理了大模型技术发展脉络,聚焦DeepSeek的核心能力与行业落地路径,结合丰富的应用案例与部署方案,为企业探索AI转型提供全方位参考。关注公众号,发送「人工智能」获取厦大3篇文档合集系列共四篇,我也会持续关注,及时更新。《第一篇:大模型概念、技术与应用实践》旨在以通俗易懂的方式系统解析大模型的核心概念、技术原理及行业应用,为读者提供从理论到实践的全方位指导。
2025-03-09 18:35:58
791
原创 一文搞懂AGI Agent(通用型AI智能体)- Manus
Manus是2025年3月由中国武汉(创始人华中科技大学毕业)团队Monica.im推出的全球首款通用型AI智能体(AGI Agent),其核心理念为“手脑并用”(Mens et Manus),旨在通过自主规划与执行任务,将用户需求转化为实际成果,而非仅提供建议。Manus标志着AI从“生成答案”到“交付成果”的跨越,其多智能体架构和工程化能力重新定义了人机协作模式。用户可通过官网申请内测(目前一个内测码已经炒到了8.8万),体验智能化闭环任务处理。一、AGI Agent**什么是AGI Agent(通用型
2025-03-09 18:34:02
915
原创 如果你是一个35岁的程序员,想要转行进入大模型领域,可以采取以下步骤来准备和规划
首先,你需要掌握一些基础知识,如机器学习、深度学习、神经网络等。可以通过在线课程、书籍、研讨会等方式进行学习。例如,你可以学习TensorFlow、PyTorch等深度学习框架。:理论知识学习后,通过实际操作来加深理解。你可以尝试自己实现一些简单的模型,或者在Kaggle等平台上参加数据科学竞赛,通过实际项目来提升自己的技能。:了解大模型领域的最新研究动态和应用场景。关注顶级会议(如NIPS、ICML、NeurIPS等)和顶级期刊,阅读相关论文,了解当前的研究热点和未来发展趋势。
2025-03-08 19:43:26
917
原创 Manus无壁垒挑战:国内多团队快速复刻,开源收获7000星,免费且透明
一夜之间,多款Manus平替出现!智东西3月7日报道,今天,MetaGPT团队用的开源AI Agent产品Open Manus在国内爆火,而来自开源平台CAMEL-AI的团队也实现“”,还贴心地将系统中涉及的每一个部件单独开源,供开发者选用。Manus以“全球首个通用AI智能体”的称号横空出世,在KOL的助力之下刷屏全网,又凭借一码难求,被炒到5万块的内测邀请码引爆营销狂欢。不过,在部分用户在研究、体验这款产品后,提出了“套壳”、运行速度过慢、token使用量惊人、性能并不出色等质疑。
2025-03-08 19:41:32
690
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人