自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1456)
  • 收藏
  • 关注

原创 利用大模型提高工作效率的两个小例子

提到大模型的价值,一般都有提高工作效率,增加客户满意度,加快创新等说法。这两天学习政策法规时,用大模型处理了两个小场景,对提高效率一说有了切实的体验。一个是生成脑图,一个是从图片格式的表格生成excel表格,两个都比较实用。

2025-07-30 19:51:48 804

原创 打工人遇见大模型:外面的世界已经这样办公了吗?

在办公场景中,制作 PPT 是最常见的工作之一。工作汇报、产品发布、活动策划、专业讲座等都需要使用 PPT。

2025-07-30 19:50:01 1021

原创 把Excel表扔给DeepSeek就能自动审计?审计人该如何正确“召唤”大模型

请教下,我想把我们公司临时工外包考勤表和合同直接批量传到AI里面去,让AI帮我做个自动审计……哪个AI工具好用些?测试数据,不涉密”

2025-07-30 19:47:54 1030

原创 AI正在改变我们的工作方式:我用大模型做了两件事

最近大模型的发展之快令人应接不睱,即便作为从业者,我也深深地感觉到**力不从心、学不过来,甚至越来越觉得自己落后于时代了**。—— **这是一件让我自己感觉到可怕的事情。

2025-07-30 19:45:15 964

原创 大模型择业思考:deepseek、字节与华为天才少年

转眼距离博士毕业已经六个月了,过去的一年时光可谓心路坎坷,时常陷于纠结犹豫之中,前一阵还收到邀请分享就业心得。因为行程安排没有能参加,趁着今天放假,就直接记录一段这段时间的心情和事情,记录的内容里,我的选择有对有错,以后或许翻出来看看会有益处。

2025-07-29 20:07:44 675

原创 AI大模型就业市场,彻底疯狂!

未来已来,只是分布不均**。”——威廉·吉布森的这句预言,正在AI时代加速验。从ChatGPT的横空出世到DeepSeek的惊艳亮相轰动全球,全球的科技巨头相继All in**AI大模型**,一场颠覆性的职业变革已悄然启动。

2025-07-29 20:06:39 587

原创 2025年大模型就业:核心技术趋势、技能要求与职业发展全景解析

随着大语言模型(Large Language Models, LLMs)的技术飞速迭代,人工智能领域正经历从通用对话工具向高度智能化、任务导向的智能体(Agent)系统的深刻转型。到2025年4月,企业对掌握LLM相关技术的专业人才需求持续高涨,核心能力聚焦于检索增强生成(RAG)、智能体任务自动化、模型对齐优化以及多模态融合。本文将全面剖析2025年大模型就业市场的技术演进路径、核心技能要求、行业应用场景、推荐实践项目以及职业发展建议,旨在为从业者提供详尽的职业规划指南,帮助其精准把握行业机遇。

2025-07-29 19:56:54 1059

原创 大模型赋能制造业数字化转型入门基础教程(非常详细),大模型入门到精通,收藏这一篇就够了!

一是推动制造业向高端化跃升。大模型通过对产品质量数据的深度分析,建立质量控制模型,并对产品质量进行实时监控,确保产品标准和质量,助力质量强国建设。例如,哈工大利用语言视觉大模型根据图像进行工业产品异常检测,并输出高质量特征描述,确保产品质量。二是助推制造业加速向智能化升级。大模型通过对生产制造全过程数据学习分析、推理演绎,结合5G、物联网、数字孪生等数字技术,实现智能化控制和决策,进一步提升制造业智能化水平。例如,基于讯飞星火认知大模型打造的羚羊工业大模型,在工业质检、工业安全等领域实现落地应用,通过打造工

2025-07-28 10:45:00 731

原创 企业AI转型行动指南入门基础教程(非常详细),AI转型入门到精通,收藏这一篇就够了!

今天分享的是由IDC和火山引擎发布的《2025年大模型应用落地白皮书:企业AI转型行动指南》,本白皮书深入探讨了2025年大模型在企业AI转型中的应用落地,指出大模型技术已进入业务深度融合阶段,企业面临高成本、模型选配等挑战,但通过精准选模、一站式服务平台及合作伙伴支持,可加快AI转型。白皮书还展示了多个行业应用案例,强调火山引擎等大模型服务商在技术支持和服务方面的重要作用,并对未来大模型技术的发展趋势进行了展望。

2025-07-27 10:45:00 899

原创 工业大模型赋能制造业数字化转型入门基础教程(非常详细),大模型入门到精通,收藏这一篇就够了!

本文聚焦工业大模型赋能制造业数字化转型的路径,构建理论分析框架,系统梳理其典型应用场景与关键痛点问题,深入探讨赋能机制与落地路径,提出推动其规模化应用的政策与技术举措。旨在为工业大模型在制造业中的有效落地提供理论支撑与实践参考,助力制造业向智能化、绿色化、高质量方向发展。

2025-07-26 10:31:57 706

原创 AI产品经理起薪30K?0基础如何转型AI产品经理?

众所周知,每个行业的发展都要经过重技术、重产品、重运营这3个阶段。第一轮AI技术的变革基本告一段落,并开始进入了重产品阶段,AI开始广泛应用在各个领域,AI产品经理薪资和需求也随之暴涨。

2025-07-25 22:20:01 917

原创 大模型概念、技术与应用实践(140页PPT读懂大模型)

在数字化浪潮汹涌澎湃的当下,大模型如同一颗璀璨新星,强势崛起并迅速成为科技领域的焦点。从最初的理论探索到如今在各个行业的广泛应用,大模型正以惊人的速度重塑着我们的生活与工作模式。它不仅是人工智能技术发展的重大突破,更是推动经济增长、提升社会治理效能、促进科技创新的关键力量。本报告将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例,旨在让大家全面了解大模型这一前沿技术,明晰其在当下及未来发展中的重要地位与深远影响 ,共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。

2025-07-25 19:44:05 861

原创 领域大模型的挑战与机遇:从构建到应用

来自 GPT4 的技术报告中指出,GPT4 仍处于通用人工智能(AGI)的初级阶段。而目前研发中的 GPT4.5 或 GPT5 则已展现出了 AGI 的某些特征。

2025-07-25 19:42:15 888

原创 怎么转行AI产品经理,从事AI的相关工作?

最近两年,我从企业服务行业转行到AI应用行业,就有不少朋友问我:>> “我没有做过AI类型的产品,在日常工作和生活中,接触过GPT、Deepseek等AI产品,我希望能够往AI产品经理或者AI相关的岗位发展,应该怎么做?

2025-07-24 20:32:27 993

原创 Deep Research开源产品的本地化部署

Deep Research技术主要是用于生成全面的报告。对于以往可能需要花费数天或者数周的时间,进行信息检索、搜集、理解、加工,并最终撰写报告的研究或分析领域,使用大模型的Deep Research技术可能在十几分钟就能得到结果。

2025-07-24 19:57:39 786

原创 大模型工作面试必备--10道大模型微调面试题

大模型微调是大模型学习的必经之路,而且在你找大模型相关工作时,微调相关问题也是避不开的!所以,今天我给大家整理了10个微调领域的面试题,请务必要收藏起来,对你一定有帮助!

2025-07-24 19:56:35 982

原创 大型语言模型的上下文工程调查报告

附图是**大型语言模型(LLMs)中上下文工程(Context Engineering)的分类体系图**,清晰梳理了该领域的核心结构,分为为 4 大板块:

2025-07-24 19:55:14 1044

原创 TableRAG:让表格保持“原汁原味”的 4 步多跳问答框架

在 RAG 系统中,传统问答系统在处理含文本与表格的异构文档时,常令用户困扰。华为云 BU 研究人员创新性地提出 TableRAG 框架,采用 SQL 执行与文本检索混合模式,尝试破解这一难题。在 HeteQA 基准测试集上,TableRAG 整体准确率相较于最佳基线方法提升超 10%,且能在 5 步内解决约 93.55% 的问题,为异构文档问答带来创新方法。

2025-07-23 16:30:28 1039

原创 AI 智能体开发框架大比拼:7 大主流开源平台和框架深度拆解对比

这两年,AI越来越火,在生活和工作里到处都能看到它的影子。AI 智能体就像一个个超级能干的数字小帮手,能自己 “看” 懂各种信息,快速做出判断,还能帮我们完成各种复杂任务。不管是处理数据、写文案,还是安排工作流程,它们都能轻松搞定,大大提高了工作效率。

2025-07-23 15:19:21 1372

原创 哈佛等团队多模态医学图像新突破!登上Nature正刊!

多模态医学图像**正成为医学AI的热门方向。近期,哈佛等团队在《Nature》发表论文,展示生成式AI在多模态医学影像解读中的突破应用,极具研读价值。

2025-07-23 15:12:25 984

原创 AI智能体的上下文工程:Manus的构建心得

在 **Manus**[1] 项目伊始,我和我的团队面临一个关键抉择:是应该使用开源基础模型来训练一个端到端的智能代理(agentic model),还是基于前沿模型(frontier models)的“上下文学习” (in-context learning) 能力来构建智能代理?

2025-07-22 19:46:14 1008

原创 RAG 三剑客:动图 + 表格秒懂传统 RAG、HyDE 与 Graph RAG 的核心差异和应用场景

传统 RAG** 的核心思想是在生成响应之前,先从一个大型语料库中检索出相关的文档或信息,然后将这些检索到的信息作为上下文输入给大型语言模型 (LLM),使其生成更准确、更相关、且减少幻觉的回答。

2025-07-22 19:44:20 814

原创 基于 LangGraph 构建 Open Deep Research 架构设计与落地实践

Deep Research 已经成为最受欢迎的 AI 智能体应用之一。OpenAI、Anthropic、Perplexity 和谷歌都推出了 Deep Research 产品,这些产品能够利用各种上下文生成全面的报告。此外,还有很多开源的实现版本。

2025-07-22 19:42:35 1024

原创 一文掌握:AI Agent Prompt是什么?智能体Prompt如何设计?

AI Agent的能力,大多藏在Prompt里,可以说Prompt决定了智能体的行为准则。它是智能体的 “行为指南”,定义了角色、任务与决策逻辑。没有好的Prompt,再强的模型也是“无头苍蝇”,反之精准的Prompt,能让Agent从机械的执行流程中解放出来,升级为可以灵活应变的智能工具,是低成本释放AI潜力的核心钥匙,更是中小企业的福音!

2025-07-21 19:46:06 894

原创 Manus 揭秘自己的7大核心技术:上下文工程架构设计与落地经验

随着 AI 智能体技术的快速发展,如何高效构建和优化 AI 智能体系统已成为业界关注的焦点。本文是对 7月19日 Manus 联合创始人兼首席科学家季逸超(Yichao 'Peak' Ji)在撰写的《Context Engineering for AI Agents: Lessons from Building Manus》一文的整理。

2025-07-21 19:44:13 636

原创 【Agent专题】Agent架构设计:12大原则详解,从0到1构建可落地的Agent系统

在AI智能体(Agent)的大潮下,构建一个真正“可用、可扩展、可维护”的AI Agent系统不再是技术大厂的专属游戏。

2025-07-21 19:43:03 693

原创 拆解Agent项目:MindSearch

这是去年出现的一个项目,这个项目的核心理念是让AI将复杂问题分解为多个子问题,并行搜索获取信息,最后综合所有信息给出完整答案。

2025-07-20 10:45:00 1043

原创 知识|AI智能体(AI Agent)从原理到应用

各种场合提到AI智能体(AI Agent),那么AI智能体究竟是什么呢?本文简单整理通俗的解读,给大家做参考。

2025-07-19 10:45:00 831

原创 工作流框架-LangGraph

LangGraph 是由 LangChain 团队开发的一个开源框架,旨在帮助开发者构建基于大型语言模型(LLM)的复杂、有状态、多主体的应用。它通过将工作流表示为图结构(graph),提供了更高的灵活性和控制能力,特别适合需要循环逻辑、状态管理以及多主体协作的场景,比如智能代理(agent)和多代理工作流。

2025-07-18 21:50:52 846

原创 论文浅尝 | 细粒度的多模态知识图谱实体表示学习(AAAI2024)

近年来,图神经网络(GNN)在图结构数据上取得了巨大成功,特别是在预训练-微调的学习范式下,这种方式能够利用大规模未标记的图数据进行模型预训练,再在下游任务上进行参数微调,从而显著提高模型性能。然而,这种范式通常假设预训练数据与下游任务数据之间存在结构一致性,即预训练学习到的图结构模式能有效迁移到下游任务。但在实际场景中,由于不同领域数据间存在本质差异,如社交网络、分子结构、生物网络等,其图结构模式差异非常明显,导致传统的微调方法无法有效迁移,甚至会造成负迁移问题,出现微调后的模型性能不如直接训练的情况。

2025-07-17 19:51:24 878

原创 动手学Agent:基础概念

虽然大家都在说2025年是Agent的元年,但如此高频的一个词,就跟好多计算机里面的概念一样,也是没有严格定义的。

2025-07-17 19:50:01 748

原创 字节 MemAgent 让 LLM 拥有“无限记忆”

不同于传统方法试图扩展上下文窗口或使用稀疏/线性注意力,MemAgent 把超长文档看作连续证据流:模型每次只读入一个固定长度的文本块,并维护一个固定长度的可覆写记忆槽(memory slot)。该记忆以普通 token 形式存在于上下文窗口内,无需修改位置编码或引入额外模块,即可让“8K 训练窗口”在推理时平滑外推到百万级 token,实现 O(N) 线性复杂度。

2025-07-17 19:47:54 690

原创 如何快速看透现象和行为背后的模型?

我看着远处的高楼、匆匆而过的人群,回想着这一天的行为,思考着市场的变化……城市像一个庞大而复杂的系统,在有序与混沌之间脉动前行。

2025-07-16 21:01:01 635

原创 2025年最强的开源AI Agent可视化编排工具深度盘点!

在AI Agent的世界里,开源意味着什么?

2025-07-16 20:20:10 1086

原创 基于 LLaMA-Factory 通过 LoRA 微调 Qwen2

LLaMA-Factory是一个由北京航空航天大学的郑耀威开发的开源框架,作为一个功能强大且高效的大模型微调框架,通过其用户友好的界面和丰富的功能特性,为开发者提供了极大的便利。

2025-07-16 20:19:07 890

原创 无需数据标注:RLSC 如何用“自我信心”优化语言模型

RLSC 作为一种强化学习微调方法,它无需外部标签、偏好模型或手动奖励设计,仅通过模型自身的“信心”作为奖励信号,就能显著提升性能。这一创新方法不仅为LLM的优化提供了新思路,且训练高效、成本较低。

2025-07-16 20:18:09 747

原创 AI Agent vs. Agentic AI | 一文带你了解:什么是AI Agent,什么是Agentic AI?

目前AI Agent特别火,但是新技术常常伴随着混乱的术语和炒作。**那么你知道AI Agent和Agentic AI之间的区别吗?**搞清楚两者之间的关系,不仅关乎学术的严谨,也关乎着下一代AI技术的的发展。本文将详细带你了解AI Agent和Agentic AI这两个概念。具体内容安排如下:

2025-07-15 19:46:26 785

原创 一文说明白Context Engineering:AI智能体的动态语境构建术

当你在ChatGPT中输入指令时,你已经接触了最基础的**提示工程(Prompt Engineering)**。但随着AI应用向复杂化、长期化、自主化发展,一个新的概念——**Context Engineering(上下文工程)**正迅速成为焦点。

2025-07-15 19:45:12 443

原创 SmolLM3:小型、多语言、长上下文推理模型

SmolLM3 3B模型在性能上超越了Llama-3.2-3B和Qwen2.5-3B,同时与更大的4B替代方案(Qwen3和Gemma3)保持竞争力。除了性能数据之外,还分享了使用公共数据集和训练框架构建它的方法。

2025-07-15 19:44:18 285

原创 一句话就能让AI模型秒变专家,微调成本直降90%

高效的模型微调既困难又昂贵!如果有一个AI模型能够帮助你动态适配大语言模型会怎样?让我们来认识Text-to-LoRA——一个通过自然语言在单次前向传播中构建LoRA适配器的超网络。

2025-07-14 20:24:54 251

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除