自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1709)
  • 收藏
  • 关注

原创 揭秘大模型概念与应用:探讨其在不同场景下的落地实践

大模型是什么?大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。这些模型需要大量的计算资源和存储空间来训练和存储,并且往往需要进行分布式计算和特殊的硬件加速技术。大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。

2024-08-28 11:26:39 1443 1

原创 医疗与大模型:重塑未来医疗生态的营销之道

医疗与大模型的结合正成为行业发展的重要趋势。面对这一机遇和挑战并存的局面,我们应积极拥抱变革、勇于创新实践。通过精准定位、打造案例、拓展合作和创新模式等多种手段相结合的方式,共同推动医疗大模型在行业的广泛应用和普及发展。那么,我们该如何学习大模型?作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2024-06-13 13:38:20 2742 1

原创 GraphGen:基于知识图谱的LLM监督微调增强方法 - 突破数据生成瓶颈!

GraphGen是一种基于知识图谱驱动的合成数据生成框架,专为解决LLM在知识密集型任务中的数据生成问题。该框架通过理解损失机制识别模型知识盲区,利用知识图谱引导生成原子、聚合和多跳三类QA数据,显著提升模型性能。实验表明,GraphGen在多个基准测试中实现超过50%的性能提升,仅用5%的高损失数据即可接近全量数据效果。

2025-09-20 08:00:00 652

原创 大模型生成测试用例秘诀:如何精准获取你想要的测试案例?

文章介绍了通过精心设计的提示词工程,让大模型生成符合个人或公司风格和要求的测试用例的方法。相比知识库建设、微调等技术门槛较高的方法,提示词工程是最快的方式。文章详细分析了测试用例的20项组成要素,将其分类为适合大模型生成、适合赋值处理和用例执行时处理三类,并提供了用例提示词和背景提示词的设计方法,最后通过Data4Test平台展示了如何实现智能模板设计,帮助测试人员高效生成测试用例。

2025-09-20 07:00:00 673

原创 (2025.10)AI产品经理面试宝典:融智通大模型产品岗33W年薪面试经验全记录!

一位211背景求职者成功获得融智通AI产品经理社招offer(年薪33W),详细分享了三面面试经验。面试问题涵盖AI大模型知识、产品设计思路、行业理解、项目经验等,包括模型区别、意图识别训练、AI审核、性能与成本平衡等专业问题。这份面经为准备AI产品经理面试的人提供了全面参考,特别是针对大模型产品方向的求职者。

2025-09-19 14:10:18 768

原创 多模态RAG长文档问答:层级索引与跨页证据的检索增强生成方案!

多模态长文档问答面临跨模态信息脱节和跨页证据整合两大挑战。MMRAG-DocQA通过构建层级索引结构(扁平化页内索引和拓扑跨页索引)和多粒度检索机制(页级父页检索和文档级摘要检索),有效解决了多模态信息关联和跨页长距离推理问题,实现了基于多模态证据的高质量答案生成。

2025-09-19 13:45:24 749

原创 大模型评测实战:构建你的LLM评测框架,轻松选择最佳模型与提示(必学教程,建议收藏)

本文详细介绍如何构建LLM评测框架,系统评估和比较不同大模型与提示模板的性能。从框架架构、评测指标设计到合成数据生成、速度优化和CI/CD集成,提供完整实现指南。作者分享构建评测框架的核心挑战与解决方案,帮助开发者识别最佳超参数组合,避免盲目选择新模型。文末推荐开源DeepEval框架作为企业级解决方案。

2025-09-19 13:42:53 497

原创 2025年校招\社招|大模型(LLM)面试核心知识体系:从基础到前沿,全面覆盖考点!

这是一份面向2025年大模型(LLM)面试的全面知识梳理,分为六大模块:基础核心与Transformer架构、模型架构演进与高效化、推理与性能优化、应用与生态、前沿趋势与开放问题以及手撕代码与智力题。内容涵盖Transformer原理、LLM训练流程、MoE架构、推理加速技术、RAG应用、多模态模型等核心知识点,并提供了备考建议和实战练习指导,帮助求职者系统掌握大模型面试所需知识。

2025-09-18 17:06:35 484

原创 【上岸实录】从12K到20K+:程序员如何转岗AI产品经理,实现薪资翻倍!

我是李雷,做技术4年,从后端开发→全栈开发→偏业务的开发,在今年年初被裁员了。找工作2个月无果后,一怒之下我转岗了产品经理。结果涨薪了60%,拿到入职20K+的产品新offer!

2025-09-18 16:47:03 920

原创 【干货收藏】MCP入门到精通:解锁大模型的“双手“,提升AI应用能力!

MCP(Model Context Protocol)是Anthropic推出的模型上下文协议,充当大模型的"双手",使其能访问外部资源执行实际任务。文章详细介绍了MCP的架构、工作原理及与Function Calling的区别,通过Client-Server模式连接大模型与外部服务,提供资源、工具和提示三种功能。文中提供了实践指南,包括在Cherry Studio中配置MCP服务的步骤,展示了如何让AI助手通过MCP实现网页内容获取、路线规划等实际操作,帮助开发者扩展大模型的应用能力。

2025-09-18 16:39:53 883

原创 大模型应用指南:企业生成式AI的四大落地场景与价值实现(建议收藏)

文章探讨了生成式AI在企业中的战略价值与应用场景。通过企业前、中、后台职能部门视角,分析了生成式AI如何赋能管理决策、优化业务流程和创新组织。现有场景可分为四类:前台业务提升、中台经营决策、后台精益管理和通用工具类,核心功能体现为对内效率提升和对外服务优化。文章强调企业应基于战略、业务、组织、技术等多因素考量,循序渐进地实现AI价值。

2025-09-18 16:37:26 665

原创 MobileLLM-R1:Meta AI如何用不到10亿参数实现2-5倍性能提升?

Meta AI发布的MobileLLM-R1是一款专注边缘设备部署的小型大模型,最大参数量不足10亿。通过架构优化(分组查询注意力、分块权重共享等)和高效训练策略(仅用4.2万亿token训练数据),该模型在数学、代码和科学推理任务上实现了2-5倍性能提升,超越了参数量更大的同类竞品。这证明"小而精"的模型设计同样能带来强大性能,为边缘AI应用开辟新可能。

2025-09-18 16:35:50 713

原创 AI编程会取代程序员吗?听听大佬们怎么说,程序员必看的未来指南!

文章探讨了AI对程序员职业的影响,介绍了多位科技大佬的不同观点,分析了AI编程工具的现状与功能。虽然AI在代码生成、补全等方面展现强大能力,但程序员的核心价值如需求分析、系统设计、复杂问题拆解等短期内仍不可替代。未来,程序员不会消失,而是会演变成"会AI的程序员",需要掌握AI工具并提升沟通能力与行业理解,增强自身不可替代性。

2025-09-17 16:12:53 667 1

原创 AI时代必备技能!零基础入门大模型应用开发,2025最新,看这篇就够了!

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2025-09-17 16:08:08 774

原创 知识蒸馏:大模型压缩与知识迁移的完整指南,解决90%模型部署难题!

知识蒸馏是一种模型压缩技术,通过大型教师网络将知识迁移到小型学生网络中。学生网络不仅学习真实标签,还模仿教师网络的软目标输出分布,保留类别间细微差异。这种技术使用温度参数软化softmax输出,通过KL散度计算蒸馏损失,并结合硬标签损失进行训练。知识蒸馏可大幅减小模型体积,同时保持接近教师网络的性能,特别适用于资源受限设备的部署。文中提供了CNN和语言模型的PyTorch实现示例,并介绍了多种蒸馏变体方法。

2025-09-17 15:54:03 611

原创 AI Agent落地难?AI Agent开发实战:破解生产级应用的三大瓶颈(附解决方案)

AI Agent正从"生成内容"向"完成任务"演进,但生产级应用面临可靠性挑战,核心瓶颈是领域复杂任务行动数据的缺失。解决方案包括构建自动数据生成引擎、高仿真环境模拟舱和优化算法以解决奖励设计、稳定训练等问题。未来AI Agent开发将从算法驱动转向算力和系统工程主导,形成"数据生成"新范式,"数据锚定"将成为关键护城河,而AI Agent可能成为下一代计算平台的"操作系统"。

2025-09-17 15:49:48 915

原创 APIPark:5分钟搭建开源AI网关,统一管理100+大模型,小白也能轻松上手

APIPark是Eolink推出的开源云原生AI&API网关,支持统一管理100+主流大模型,提供统一接口规范、高性能网关、流量监控等功能。采用模块化架构,支持Docker和Kubernetes一键部署。适用于企业AI中台、多模型容灾和开放API平台等场景,Apache-2.0许可可免费商用,帮助开发者简化大模型接入流程,降低运维复杂度。

2025-09-17 11:40:26 696

原创 如何逼自己3个月掌握工业级开发能力?AI架构师超详细学习路线图,适合0基础小白!

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

2025-09-16 15:59:49 1069

原创 【大模型学习书籍推荐】AI领域名家名作,AI大模型三本经典教科书!小白到程序员的进阶宝典!

文章介绍了三本大模型领域经典教材:《大语言模型》(人大赵鑫教授团队)、《大模型基础》(浙大毛玉仁团队)和《大规模语言模型:从理论到实践》(复旦张奇教授团队)。这些书籍系统涵盖大模型基础理论、架构演化、提示工程、微调技术及应用场景,适合从本科生到技术人员的不同层次学习者,且均有公开PDF版本可供免费获取。

2025-09-16 15:51:33 638

原创 大模型工程化之路:分层架构设计与落地实践(值得收藏)!大模型应用

文章提出企业AI能力应采用分层架构,分为开发工具链层、平台与流水线层、运营治理层和算力框架支撑层。这种架构能明确职责、促进复用、便于治理。文章提供了从POC验证到规模化复制的三步落地路线,强调了数据版本管理、成本控制和业务KPI评估的重要性,旨在将模型研究成果转化为持续的业务价值。

2025-09-16 15:49:03 751

原创 WebGPU大模型部署:浏览器中实现离线AI对话的终极方案!大模型部署

Qwen3 WebGPU项目允许用户在浏览器中离线运行Qwen3-0.6B大语言模型,无需安装且数据完全本地处理,保障隐私。该项目利用WebGPU硬件加速、Transformers.js和ONNX Runtime Web技术,代表了AI应用边缘化、去中心化和隐私优先的未来趋势,为开发者提供了在网页中集成强大AI功能的新可能。

2025-09-16 15:47:32 808

原创 一文搞懂大模型:上下文工程 (Context Engineering)vs 提示词工程(Prompt Engineering)

上下文工程是让AI理解完整情境背景,提供智能个性化服务的核心技术,与仅关注单次交互的提示词工程形成对比。通过RAG检索、动态上下文管理和长期记忆系统等技术,解决AI的"记忆瓶颈"问题,使AI能记住用户偏好、理解情境、跟踪目标进展,实现从"每次重新开始"到"基于理解继续"的智能进化,建立真正的"工作关系"而非反复"重新介绍"。

2025-09-16 11:40:54 1075

原创 (2025最新)产品经理转行大模型产品经理基础教程:大模型开发学习路线与实战资源,一定记得收藏!

本文分享了非算法背景者转行AI产品经理的可行路径与优势,指出当前市场需求大、薪资优渥且能接触前沿技术。文章提供从初阶应用到商业闭环的四阶段学习体系,包含大模型应用、RAG系统、模型微调及部署等实战内容,并附赠学习路线图、视频教程等免费资源,帮助小白系统掌握AI产品技能。

2025-09-15 16:22:25 1390

原创 AI浪潮下的企业新机遇:开发降本增效,代码生成工具大揭秘!

文章探讨AI如何为企业开发部门带来变革,特别是通过代码生成工具如ScriptEcho和OpenAI Codex大幅减少开发工作量。案例显示,使用AI可使开发成本降低94.7%,显著提升效率。同时提醒AI应用存在技术失误、数据隐私等风险,建议企业通过AI转型、降低技术门槛和培养复合型人才来拥抱AI,实现降本增效和创新发展的目标。

2025-09-15 16:19:50 641

原创 免费薅羊毛结束!网站联合反击,AI公司必须付费才能获取数据!ChatGPT等AI公司要慌了…

互联网网站和公司如Reddit、Medium等联合推出RSL标准,要求AI公司为使用其数据内容付费,结束过去"白嫖"数据训练AI模型的时代。Cloudflare建立数据交易市场让网站自主定价,这场变革可能影响AI模型训练质量,标志着AI与内容提供者关系的重要转变。

2025-09-15 16:09:05 914

原创 【AI+医疗】大模型在护理领域的应用与未来!大模型应用

人工智能正在革命性地改变现代护理实践,通过智能技术提升患者护理质量并减轻护士工作负担。AI在患者监测、诊断辅助、行政工作和药物管理等方面发挥重要作用,帮助护理从"反应式"向"预测式"转变。AI作为智能助手减轻护士认知负担,提高工作效率,使其能更专注于复杂护理和情感交流。尽管面临培训和伦理挑战,AI与护理的深度融合将创造更高效、个性化的医疗未来。

2025-09-15 16:07:49 1167

原创 RAG检索质量提升指南:查询翻译的6大核心策略,让RAG检索精准度提升80%!

本文详细介绍了RAG系统预检索优化环节中的查询翻译策略,包括查询重写、多查询、RAG融合、查询分解、回溯提示和假设文档嵌入六种方法。这些策略通过优化用户查询,提升检索精确度和召回率,解决查询表达模糊、不准确等问题。文章提供了具体代码示例和应用场景建议,帮助开发者根据实际业务需求灵活组合使用这些策略,构建更高效的RAG系统。

2025-09-15 11:45:34 569

原创 从入门到精通:RAG应用开发全攻略 | 附架构演进与优化指南 | 程序员必学收藏

本文详细解析了RAG应用的经典架构与流程,包括数据索引阶段(加载、分割、嵌入、索引)和数据查询阶段(检索、生成)。文章探讨了RAG应用面临的五大挑战:检索召回精确度、大模型抗干扰能力、上下文窗口限制、RAG与微调的选择以及响应性能问题。同时,介绍了RAG架构从Naive RAG到Advanced RAG再到Modular RAG的演进过程,为开发者提供了系统性的RAG应用开发与优化指南。

2025-09-14 07:45:00 847

原创 【AI产业链拆解】深入浅出数据标注:解锁大模型训练的钥匙(值得收藏)

数据标注是AI产业链的核心环节,为AI模型提供训练"教材"。它经历了从简单"贴标签"到复杂全流程服务的转变,在AI不同阶段(预训练、强化学习、应用)有不同要求。行业正向自动化、专业化方向发展,从2D到3D/4D标注,从通用数据到垂直领域深度服务。数据标注的质量直接决定AI能力,是AI落地的关键基础。

2025-09-14 07:00:00 1018

原创 LLM学习完全指南:从零基础到实战应用,程序员必备的完全攻略!

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

2025-09-13 15:40:07 958

原创 GitHub爆火项目:揭秘ChatGPT/Claude/Gemini等AI大模型的系统提示词,建议收藏学习!

"system_prompts_leaks"GitHub项目收集了主流AI大模型的系统提示词,揭示其五大设计规律:模块化分层结构、精确边界控制、动态策略调整、情绪价值提供和安全处理机制。这些提示词通过分层指令、明确禁止行为、动态适应策略、预设性格配置和多层安全机制,指导AI模型如何回应不同场景,确保安全性和用户体验。

2025-09-13 15:36:00 524

原创 阿里又又又开源了!Qwen3-Next-80B-A3B-Thinking:成本降90%推理提速10倍!

阿里巴巴推出Qwen3-Next-80B-A3B-Thinking模型,采用超稀疏MoE架构和混合注意力机制,总参数800亿但仅激活30亿参数,实现训练成本降低90%、推理速度提升10倍。该模型支持256K令牌长上下文,在复杂推理任务中表现优异,性能超越多个同类模型,已在Hugging Face和ModelScope等平台开源,为企业和研究者提供高效AI推理解决方案。

2025-09-13 11:54:34 1149

原创 2025年程序员转行AI大模型全攻略:超详细学习路径,轻松转型人工智能!

传统程序员转行到AI大模型领域是一个既充满挑战又蕴含机遇的过程。以下是一份详细的指南,旨在帮助程序员顺利过渡到这个新兴且快速发展的行业。

2025-09-12 18:13:02 802

原创 AI大模型引领风潮!新兴岗位崛起,未来3年程序员的最佳就业选择!

文章摘要:大模型应用开发正处于黄金发展期,市场人才需求旺盛,薪资溢价显著。当前大模型应用开发处于起步阶段,RAG和Agent等新兴方向带来大量机会。文章建议开发者及时布局AI领域,并提供了7个阶段的大模型学习路径,包括系统设计、提示词工程、平台开发等。作者还分享了包含学习路线图、商业方案、视频教程等在内的大模型学习资源包,可通过扫码免费获取。掌握大模型开发技能将帮助开发者应对未来技术变革,提升职业竞争力。

2025-09-12 17:36:04 826

原创 大模型提示词工程全解析:从入门到精通的实用框架!大模型入门

本文详解大模型提示词工程的原理与方法。将大模型比作"名校实习生",强调提供清晰完整指令的重要性。解析思维链(COT)、零样本等概念,分享CRISPE框架及多种实用提示词模板。提示词工程核心是提升表达能力,通过大量阅读和实践,让大模型输出更符合预期结果。

2025-09-12 16:34:48 890

原创 RAG应用开发指南:从原型到生产,LlamaIndex与LangChain框架助力快速构建与落地!

随着大模型技术的发展,我们已经具备了开发完整 RAG(Retrieval-Augmented Generation,检索增强生成)应用的技术能力。借助 LlamaIndex、LangChain 等成熟框架,可以在较短时间内实现从原型到应用的快速构建。然而,真正将 RAG 应用推向生产环境,远不只是“搭建起来”那么简单,仍有许多问题值得提前思考与应对。

2025-09-12 10:57:04 794

原创 浦东新区:AI创新应用先导区,垂类大模型引领产业变革,37个案例展示未来趋势!

文章介绍了浦东新区作为全国首个人工智能创新应用先导区,在垂类大模型应用方面的创新实践。通过37个典型应用场景案例,展示了大模型在医疗康养、智能制造、航空航天等多个领域的落地应用,形成了可复制、可推广的标杆应用。浦东依托"硬核"产业生态,为AI应用提供从研发到商业化的全生命周期支持,AI产业规模已超1600亿元,成为大模型技术商业化的重要试验田。

2025-09-12 10:50:40 740

原创 小白/程序员转战AI产品经理:3个月涨薪30%的转型秘籍与避坑指南,这3个方法所有人都适用!

文章分享了产品经理转型AI产品经理的三个关键经验:1) 明确适合的AI产品经理类型(应用型而非专业型),聚焦算法应用场景而非技术细节;2) 简历突出AI关键词和项目经验,展示如何解决业务痛点;3) 面试时大胆尝试,从产品定位而非技术角度描述项目。作者强调AI产品经理需兼具产品专业技能和行业业务知识,并推荐通过系统学习和实战项目积累经验,以抓住AI时代机遇。

2025-09-11 16:13:56 1071

原创 大模型转行全攻略:选方向、避坑、快速入门,一篇搞定,建议收藏!

文章解析大模型行业四大岗位方向:数据工程师、平台工程师、算法工程师和部署工程师,分析各岗位特点与要求。针对新手,提醒算法岗门槛高,建议应届生和转行者优先考虑数据岗或平台岗作为切入点。强调数据质量和工程能力的重要性,指出大模型不只有算法,工程基建同样关键,并建议深耕垂直领域,培养数据敏感性,避免只关注模型调优的误区。

2025-09-11 16:10:46 493

原创 大模型评估完全指南:从指标拆解到技术路径,一文读懂如何科学评估大模型性能!

本文系统介绍大模型评估方法论,提出评估需遵循相关性优先、可复现性和全面性三大原则。从能力、效率、安全、鲁棒性四个维度构建评估指标体系,详细阐述评估技术路径,包括定义任务、构建数据集、选择评估方式等。同时提醒评估中的常见误区,并推荐OpenAI Evals、HELM等实用工具,帮助读者建立科学、可落地的大模型评估体系。

2025-09-11 11:44:16 798

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除