自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1542)
  • 收藏
  • 关注

原创 所有人都在讨论的“DeepSeek”究竟是啥,我们应该如何正确使用(建议收藏)

最近一夜爆火的DeepSeek,中文名“深度求索”,引起了全网的激烈讨论,热度居高不下。

2025-02-05 17:07:34 31392

原创 Deepseek v3开源,本地仅700G可轻松运行!

根据多个基准测试,DeepSeek v3 在代码方面甚至优于 Claude Sonnet 3.5那么671B的DeepSeek V3如何本地运行尼,由于DeepSeek的框架原生采用 FP8 训练,因此仅提供 FP8 权重,预估仅700GB+显存便可轻松运行。当然也可以转换到BF16,在半精度下,需1400GB+量化到int4时需要300GB+半精度 236B的DeepSeek V2,占用 490G 显存,需要 7张 80G A100。

2024-12-28 10:35:53 13811

原创 RAGFlow安装教程 | 带你一步步搭建RAGFlow【干货分享】

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-11-12 10:32:53 23109 3

原创 一文彻底搞懂深度学习:注意力机制(Attention Mechanism)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-11-07 11:41:45 34480 3

原创 一文彻底搞懂多模态:模态表示、多模态融合、跨模态对齐

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-31 20:28:08 74563 3

原创 万字长文,带你搞懂什么是BERT模型(非常详细)看这一篇就够了!

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-25 10:20:54 62820 1

原创 手把手教你Ollama 安装部署教程,一键搭建本地大模型,不挑环境、不挑配置!

macOS:Linux:Windows:AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-22 10:22:54 81953

原创 AI大模型 | OpenAI o1(最强推理模型)看这一篇就够了!

我们即将推出OpenAI o1,这是一种经过强化学习训练的新型大型语言模型,用于执行复杂的推理。o1在回答之前会进行思考——它可以在回应用户之前生成一个长长的内部思路链。-- Open AI 官方定义强化学习训练:o1模型的核心在于其采用了。

2024-09-20 11:07:22 15530

原创 大模型入门到进阶:什么是 RAG?为什么需要 RAG?RAG 的流程

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频,免费分享!

2024-08-14 09:49:08 38293 1

原创 一文了解什么是 RAG?为什么需要 RAG?RAG 的流程!

本文从大模型的局限性切入,探讨了检索增强生成架构的核心机制及其带来的好处。RAG 通过结合检索和生成能力,能从外部知识库搜索相关信息,生成更准确的回应,有效克服了大模型在知识更新上的短板。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

2024-08-01 20:54:35 11437

原创 告别上帝视角!NeurIPS 2025 直击痛点:多模态大模型如何在第一视角下搞定动态时空?

EOC-Bench旨在评估多模态大语言模型第一视角下的物体级认知能力。EOC-Bench在涉及动态以自我为中心互动的场景中全面评估MLLMs,包括过去、现在和未来三个时间维度。为了确保高质量,EOC-Bench设计了多种题型的任务模式,并引入了多尺度时间准确率指标,以提高开放性问题的精确度。针对多种专有和开源模型进行的广泛评估显示,许多MLLMs在具身物体认知任务上面临挑战,特别是在回忆和处理过去信息以及绝对时间感知方面,希望EOC-Bench将推动开发能够理解更复杂和多样化的物理世界的模型的进步。

2026-01-07 17:43:59 793

原创 旺知识:2025年搜推广多模态大模型表征和创意生成技术业界进展与趋势-Google、Meta、阿里、字节

在当前以大模型为核心驱动力的 AI 时代,搜索、广告与推荐(统称为“搜推广”)领域正经历着从“以 ID 标签特征为中心”向“以内容语义为中心”的范式跃迁。传统的推荐系统长期依赖于稀疏的 ID 特征(如 User ID、Item ID),这种模式虽然在处理大规模点击率预测任务中具有极高的计算效率,但随着业务深入,其在冷启动、长尾内容分发以及跨领域迁移方面的局限性日益凸显。

2026-01-07 17:39:31 956

原创 程序员必看!TRACE多模态检索神器:让时间序列数据“开口说话“,AI开发新神器!

TRACE是一个多模态检索框架,通过通道偏置注意力和旋转位置编码处理多变量时间序列,结合交叉注意力与双重硬负例挖掘实现样本级和通道级的语义对齐。该框架支持检索增强生成,为时间序列基础模型提供相关上下文,提升下游任务性能。TRACE开源代码已发布,为AI开发者提供了处理时间序列与文本对齐问题的有效工具。

2026-01-07 17:38:06 493

原创 爆肝整理!AI Agent开发全栈指南:架构、选型、落地避坑,助你打造企业级“数字员工“

文章探讨了AI Agent作为新一代应用范式的演进路径,详细解析了从环境感知到持续迭代的Agent架构,并通过金牌店长与调度老师傅两个典型案例,展示了如何将业务能力封装成可复用、可治理的"数字员工"。同时提供了工程化关键技术、技术选型及落地避坑指南,助力开发者构建能听懂话、会判断、能行动的企业级智能体系统。

2026-01-07 17:37:34 774

原创 爆肝!多模态大模型的“翻译官“:模态对齐技术详解,让AI不再“鸡同鸭讲“!小白程序员也能秒懂的跨模态黑话

文章介绍了多模态模型中的模态对齐技术,包括表征级、局部级和语义层三条技术路径,以及训练数据不靠谱、细节对齐能力差、动态场景跟不上和抗干扰能力弱四大挑战。同时提出了分布级对齐、RLAIF-V框架、动态图注意力对齐和因果推断增强四项最新突破。未来发展方向是通用化、高效化和可解释性对齐,为多模态应用奠定基础。

2026-01-07 17:37:03 536

原创 【硬核干货】从SEO到GEO:AI时代的“流量密码“,程序员必学!大模型黑箱背后的优化全攻略

文章讲述了GEO(生成式引擎优化)这一新兴领域,类似于SEO但针对大模型。服务商通过优化内容提高品牌被AI抓取展示的概率,市场快速增长但效果难保证。大模型公司面临高额研发成本和商业化难题,考虑植入广告,但可能影响用户信任。大模型也在不断进化,提高对低质量内容的识别能力,GEO技术需不断创新才能持续有效。

2026-01-06 15:45:34 620

原创 【AI内卷时代,如何选择?2025年国产大模型排行榜深度解析,小白程序员必看!网站用DeepSeek,手机选豆包,效率直接起飞!】

国产AI大模型发展迅速,百度文心一言、腾讯元宝、阿里通义千问等纷纷入局。根据2025年最新数据,网站端访问量DeepSeek居首,APP端豆包领先。头部互联网企业占据竞争优势,对于大多数用户,网站端使用DeepSeek,手机端选择豆包AI即可满足需求。两大模型均拥有强大技术支持和丰富用户经验,是编程开发者的理想选择。

2026-01-06 15:44:31 1535

原创 OMG!500个AI Agent实战项目免费领!CrewAI、AutoGen、Langgraph全框架覆盖,小白也能秒变AI大神!

文章介绍了一个包含500+AI Agent实战项目的合集,覆盖CrewAI、AutoGen、Agno、Langgraph等主流框架,每个项目都有完整代码和详细文档。这些案例帮助开发者快速上手AI Agent开发,解决商业化落地难题,从小说创作、供应链优化到客服机器人等多种场景,让小白也能轻松运行,少走弯路,直接站在巨人肩膀上学习AI技术。

2026-01-06 15:43:51 280

原创 震惊!2025年AI编程助手已能写代码,程序员们慌了吗?盘点豆包、通义千问、WPS AI谁是开发者的最佳拍档!

当清晨的第一缕光透过窗帘,一位懂你日程、知你冷暖的“AI伙伴”也开始了一天的工作。一杯咖啡氤氲的香气里,行程梳理妥当,甚至晨会的简短发言提纲也已拟好;通勤路上,昨晚未看完的项目文档转化为语音播报,自动标注出关键数据;在工位前,面对庞杂的数据报表,秒级生成可视化图表;下午和客户见面前,输入核心思路,它快速生成PPT初稿,还匹配符合品牌调性的排版与配图;回家途中,语音告知晚餐需求,它会推送适配食材库存的菜谱,甚至联动智能家居提前预热厨具;入夜,当你准备休息,它已筛选好明日最重要的资讯,并道一声“晚安”……

2026-01-06 15:43:12 897

原创 【AI开发新姿势】国内直接调用GPT-5、Claude 4.5!Cherry Studio配置全攻略,小白也能上手

文章详细介绍了国内开发者如何通过CherryIN平台访问全球先进大模型(如Gemini 3 Pro、Claude Sonnet 4.5等)。内容包括平台注册、充值、模型选择、使用日志查看等基础操作,以及如何在Cherry Studio中配置和使用这些模型。文章还提供了API调用代码示例,帮助开发者在项目中集成这些大模型,并强调了平台支持国内外模型且部分提供免费版本,为国内AI开发者提供了便捷的全球大模型接入方案。

2026-01-06 15:38:56 717

原创 大模型yyds!Sunway打造“智监慧审“专家智能体,用Python实现智能监管,小白也能秒懂!

文章介绍了AI大模型如何重塑检验检测行业的监管模式,解决监管覆盖不足、机构问题频发等痛点。通过Sunway开发的"智监慧审"专家智能体,实现了从"人盯机构"到"数据驱动"、从"事后处罚"到"生态治理"的转变。该智能体通过体系合规性、业务过程执行和检测报告三个层次的审查,实现风险逐层筛查,推动监管与行业形成"质量提升-信任增强-价值创造"的正向循环。

2026-01-06 15:36:18 754

原创 AI狂飙!2025最强编程大模型对决!Gemini、GPT、Claude谁更胜一筹?开发者速来围观!

文章介绍了2025年最新发布的顶级大模型:Google Gemini 3、Anthropic Claude Opus 4.5、OpenAI GPT-5.2和DeepSeek V3.2。这些模型在推理、编程和多模态理解方面取得重大突破,Claude Opus 4.5编程测试达80.9%,DeepSeek V3.2-Speciale在多个国际竞赛中夺冠。SuperCLUE测评显示GPT-5.1综合表现领先,DeepSeek-V3.2-Exp-Thinking是最佳开源模型,标志着AI技术在编程和复杂问题解决能力

2026-01-06 15:35:20 1032

原创 震惊!国产大模型‘内卷‘真相:不是技术不行,而是思维被锁死?程序员必看!

国产AI大模型与国外存在代差,根本原因并非算力或算法不足,而是五方面问题:路径依赖导致缺乏原创创新;高质量数据结构性贫血;KPI驱动的短视科研模式;组织机制缺乏敢于挑战常识的科学领袖;过度关注应用而忽视基础研究。AI是一场马拉松,需要打破思维惯性,培养创新胆识,在深耕应用的同时,挺进无人区寻找真正属于自己的技术突破。

2026-01-06 15:34:33 918

原创 拥抱大模型:深入剖析ReAct的核心原理、技术架构及其对AI领域的深远影响

摘要: ReAct(Reasoning+Acting)是一种突破性的智能体架构,通过“推理-行动-观察”(TAO)闭环机制,解决大语言模型的“黑箱”问题。其核心思想是模拟人类认知过程:模型显式生成推理轨迹(Thought),调用外部工具执行行动(Act),并基于反馈(Observe)动态调整策略。ReAct具备显式推理、环境锚定和少量样本泛化三大特征,通过模块化设计(核心逻辑层、执行循环层、外部交互层)实现任务拆解与实时交互。该范式显著提升了AI的可解释性、准确性和适应性,为复杂任务处理提供了新路径。

2026-01-06 15:33:57 648

原创 救命!Gemini 3.0 Pro编程能力逆天,AI帮你写bug都能变神级代码!

世界上最先进的大模型,一是Gemini 3.0 Pro,一是12.12刚发布的GPT 5.2,还有就是Gemini 3.0 Flash也非常厉害!本文介绍的是Gemini 3.0 Pro的能力特性。如果您想跳过Gemini 3.0 Pro的能力展示,想直接使用这些世界上最先进的大模型(还有免费版哦),可以使用国内的AskManyAI网站,可以直接、流畅地使用:(以下是对Gemini 3.0 Pro的能力与特点介绍)Gemini 3.0 Pro于2025.11.18发布后,在全世界引发了强烈的反响。在世界上所

2026-01-06 15:33:24 342

原创 别再叫它“猜词器“!大模型视觉认知新发现,让AI开发者直呼内行

最新研究证实,大语言模型(LLM)能产生与人类大脑高度相似的视觉表征,并非简单的"猜词器"。研究团队通过多项实验发现,LLM能整合场景描述中的复杂语义信息,捕捉人脑观看图像时的深层视觉表征。基于LLM训练的神经网络在较少数据下即可实现与人类视觉皮层高度一致,这为AI开发提供了新方向:未来大模型设计可能更注重数据结构而非规模堆砌,为类脑智能系统开发开辟新路径。

2026-01-05 16:26:59 764

原创 【AI程序员必看】2025年12月全球AI大模型热度榜TOP20!从DeepSeek到豆包,技术趋势全解析,yyds!

AIGCRank发布2025年12月《AI产品热度榜单》和《AI大模型热度榜单》,基于全球应用市场、社交媒体、搜索引擎指数等综合评估。产品榜单涵盖豆包手机助手、钉钉AgentOS等20款热门AI应用;大模型榜单包括DeepSeek V3.2、GPT-5.2、豆包Seed 1.8等20个前沿大模型。榜单通过常态化监测体系,捕捉AI领域最新动态,为开发者提供市场参考与技术风向。

2026-01-05 16:26:09 874

原创 企业级大模型预训练全流程曝光!想象力科技手把手教你打造“懂行“的AI助手,附源码和实战经验

想象力科技公司发现通用大模型难以理解和应用公司内部专业知识与价值观,决定从AI应用者转变为AI构建者。文章详细介绍了大模型预训练的全流程,包括AI聊天原理、数据集构建、Tokenization、词汇表、词嵌入、架构设计和训练优化等关键技术环节,最终打造出能够理解公司内部知识的基础模型,为后续开发个性化AI助手奠定基础。

2026-01-05 16:25:23 826

原创 2026年AI将取代90%程序员?不,这些岗位反而要涨薪300%!小白必看大模型开发“躺赢“指南!

2026年AI将进入多智能融合阶段,"托举"而非替代人类。未来将涌现"紫领"等新职业,中国走产业赋能差异化路径。AI已在个人工具和产业中广泛应用,带来技术、产业、社会和教育变革。个体应学会与AI协作打造独特竞争力;企业需拥抱开源生态;全球应加强协作推动AI普惠。AI是人类文明新起点。

2026-01-05 16:24:51 568

原创 80%国产大模型都在用MoE!AI编程开发选型攻略大公开,小白也能秒懂!

本文全面梳理了15款国产主流大模型,包括阿里巴巴通义千问、百度文心系列等,指出MoE已成事实标准,激活参数集中在20B-50B。企业级应用更关注推理效率、稳定性和可部署性,国产大模型路线明确追求"在现实算力条件下可规模部署",而非单纯追求理论最强。

2026-01-05 16:24:19 526

原创 卷不动了?2025大模型开发新趋势:6款AI工具让程序员效率提升10倍!

本文总结2025年AI行业最新动态:大模型企业资本化加速(MiniMax上市)、AI芯片市场扩张(昆仑芯IPO)、政策支持AI应用(央行金融AI政策)、技术创新突破(清华TurboDiffusion、MiniMax M2.1大模型)及投融资热潮(月之暗面C轮融资、OpenAI大规模融资)。AI向教育、金融、机器人等垂直领域渗透加速,应用落地成效显著。

2026-01-05 16:23:45 731

原创 AI量化新风口:LLM大模型让策略开发效率翻倍,小白程序员也能逆袭的量化神器

文章详解LLM在量化投资的四大应用:提升研究与工程效率(节省30%编码时间)、信号提取与因子挖掘(处理非结构化数据)、交易决策与智能代理(生成交易信号)、量化与基本面融合(打破团队壁垒)。LLM核心价值是放大人类能力而非替代,需警惕时序泄露和过拟合问题,建议将其视为高效工具,结合量化严谨逻辑使用,同时注意合规要求。

2026-01-05 16:23:10 818

原创 AI工程师必备!掌握这四大训练范式,让你的模型性能翻倍,效率提升N倍【附代码】

文章系统梳理了机器学习四大前沿训练范式:迁移学习解决数据不足问题;微调技术实现高效模型适配;多任务学习通过知识共享提升效率;联邦学习保障数据隐私安全。详细解析各范式的原理、实现方法、适用场景及选择策略,帮助开发者根据实际需求组合应用,构建高效机器学习系统。

2026-01-05 16:21:19 798

原创 大模型强化学习完全指南:从PPO到DAPO,一文掌握LLM训练黑科技,小白秒变AI大神,代码示例+实战技巧全奉送!

文章系统梳理了LLM强化学习算法的演进历程,从基础的REINFORCE到最新的DAPO算法。详细解析了PPO、DPO、GRPO和DAPO的原理、优缺点及适用场景,展示它们如何解决大模型训练中的稳定性、计算成本和效率问题。这些技术让模型能够自主推理、自我修正,为企业定制化AI提供了无需大量正确数据的解决方案。

2026-01-05 16:20:45 535

原创 大模型Agent开发全攻略:一文吃透记忆、规划、行动、工具四大核心模块,代码开源实战!

文章全面解析了大模型Agent技术的核心架构与实现方法,详细介绍了记忆、规划、行动和工具四大模块的设计原理与应用场景。文章指出,Agent已成为大模型落地的主要范式,通过RAG技术、多轮对话系统、搜广推应用和自优化闭环等创新,实现了从理论研究到实际应用的跨越。开发者需掌握通用AI技术的同时,注重模块的定制化设计与工程实践,才能构建高效的Agent系统。

2026-01-04 16:06:08 757

原创 做Agent还在死磕Prompt?颠覆你的认知:Agent工程的本质其实是构建环境,这篇讲透了!

选择在这个时间点开始更新公众号,确实是有些内容想要分享和表达的。主要是记录 Agent 工程实践和落地的一些细节,记录搭建过程的研究,希望在输出分享的过程越来越形成体系。另外就是自己使用 AI 过程时的一些小技巧吧,大家都知道的就不写了,写一些自己摸索出来的,或者比较少人知道但是有意思的。

2026-01-04 16:04:18 505

原创 别再只会写Prompt了!AI Agent开发才是程序员的未来,从小白到大神的全栈指南

文章主要介绍了AI Agent技术,强调其专注于"把事办成"而非简单对话。解析了AI Agent的五大核心能力、三种协作模式及关键技术组件。探讨了多智能体系统的常见难点,强调AI开发需向工程化演进,为程序员提供了系统学习Agent开发的完整路径。

2026-01-04 16:02:24 605

原创 震惊!2026年AI Agent开发路线图曝光!6个阶段从小白到全栈,这波红利必须抓住!

文章详细介绍了2026年AI Agent全栈开发的六阶段学习路线:觉醒期(基础交互与工具调用)、记忆期(RAG与向量数据库)、架构期(状态与工作流)、社会期(多智能体协作)、具身与实操期(Computer Use & Edge AI)以及工程化与落地期。强调当前是入局Agent开发的最佳时机,工具链已成熟并标准化,开发者可专注于智能流设计。每个阶段均列出核心目标、必学知识点和实战项目,帮助学习者循序渐进掌握技能。

2026-01-04 16:01:42 708

原创 【AI Agent】我悟了!原来这才是大模型的终极形态,小白也能构建自己的智能决策系统!

AI Agent是今年热门技术,核心特征是"自主决策",区别于传统AI工具。它具备规划决策、工具调用、记忆学习三大能力,能根据任务动态调整步骤、循环迭代并利用上下文记忆。构建AI Agent需具备反思、工具使用、规划推理和多智能体协作四大能力。未来每个SaaS产品都可能被Agented版本重新定义,开发者应掌握Agent设计思维,成为设计智能体协作框架的专家。

2026-01-04 16:00:38 844

原创 震惊!AI Agent彻底改变编程世界!大模型+工具=指数级效率提升,小白也能秒变大神!

文章介绍了AI Agent的概念、特征、与大型语言模型的关系、核心组件、工作流程、分类、应用场景及发展前景。AI Agent是一种能感知环境、决策并采取行动的智能系统,具备自主性、反应性、主动性等五大特征,由大语言模型、记忆、规划、工具使用四大核心组件构成,通过感知-思考-决策-行动-学习与反思的闭环工作流程运行。AI Agent已在多个领域应用,市场规模预计到2028年将达到285亿美元,但同时也面临数据隐私、技术可靠性等挑战。

2026-01-04 15:57:14 426

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除