自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(169)
  • 问答 (2)
  • 收藏
  • 关注

原创 2025大模型学习全攻略:从小白到专家,一站式进阶之路,收藏这一篇就够了!

随着人工智能技术的迅猛发展,大模型(Large Models)已成为这一领域的新宠。从GPT系列到BERT,再到各类变体,大模型以其强大的能力吸引了无数开发者和研究者的目光。那么,作为一个零基础的学习者,如何快速入门并精通大模型技术呢?本文将为你提供一份详尽的学习指南。

2025-05-24 13:44:29 1049

原创 大模型入门知识大全:零基础到精通,一篇文章搞定,值得收藏!

采用提问方式,从个人知识盲点开始,渐进式掌握大模型入门知识点。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍1、大模型中7b、70B代表什么在讨论人工智能领域特别是大型语言模型(LLMs)时,“7b”和“70B”均用来表示模型所包含的参数数量。这里的“b”是英文“Billion”的缩写,意思是“十亿”。

2025-05-24 13:42:47 1078

原创 从“+AI”到“AI+”:大模型重构产业格局的实践与展望

例如,在本届科博会上,网易有道推出的AI答疑笔,通过植入DeepSeek-R1模型的深度推理引擎,将教育硬件的核心竞争力从资源堆砌,升级为“启发式交互”,其答疑过程兼具启发式教学、逻辑可视化呈现及拟人化交互特质,将为用户创造媲美真人教师的沉浸式学习体验。在工业领域,上海羚一科技将“AI+工业”确定为企业发展方向,通过从数据到应用的一体化智能体解决方案,满足制造企业在设计、采购、制造、管理等领域的AI+业务协同需求,助力工业企业在金砖国家的港口基建、装备制造等项目。

2025-05-24 13:38:37 619

原创 【本地部署】千问开源Qwen3,开源模型卷起来~小模型能力强-尝鲜

Qwen3凭借混合推理架构和分层参数激活策略,在性能和成本效率上实现突破。本文介绍如何在Win11系统上本地部署最小版本qwen3:0.6b模型:通过ollama工具下载模型后,使用chatbox进行交互。若遇报错需检查ollama版本,升级后即可正常运行。该方案适合资源受限场景的快速部署体验。

2025-05-24 11:59:39 165

原创 AI医疗企业盘点:谁在领跑AI医疗智能体赛道?

近日,复旦大学附属中山医院与联影医疗在《元宇宙医学》创刊一周年暨医学人工智能创新发展研讨会上联合发布了六大医疗智能体。这一举措标志着双方在医疗 AI 领域的合作迈入了新的阶段,为医疗行业带来了前所未有的变革。今天,小医来为大家深度解析AI+医疗方向的智能体业务,并且介绍该方面表现卓越的公司,涵盖其核心技术和业务亮点,最后对该业务方向上的公司进行汇总整理。

2025-05-24 11:52:14 874

原创 谷歌版「智能体」白皮书,中英文 pdf,AI 应用必备。

AI智能体Agent或成未来技术焦点,谷歌白皮书详解其运作机制AI智能体(Agent)正成为下一代人工智能的核心发展方向。根据谷歌42页技术白皮书,智能体通过"目标-工具-计划"三件套,将传统AI模型升级为"数字化实干家":核心能力突破:智能体不仅具备知识储备,还能调用现实工具(API、数据库等)执行复杂任务三大技术支撑:扩展插件实现即插即用功能函数调用协调外部应用程序数据存储访问私有信息库智能决策循环:遵循"推理-行动-观察-重复"的认知架构,结合ReAct等策略完成目标

2025-05-24 11:50:22 523

原创 AI Agent智能体在现代医疗保健中的革命性作用:从基础到先锋,临床环境中的影响、整合与实施路线图

人工智能代理通过推进临床决策支持、自动化工作流程和个性化患者护理,正在改变医疗保健。本综述将人工智能代理分为四种进步模型:基础型、助手型、合作伙伴型和先锋型,每种模型代表逐渐增强的自主性和临床整合。我们贡献的核心是一份全面的实施路线图,该路线图利用模块化架构,包括感知、推理、互动和记忆组件,以实现这些多样化人工智能代理的无缝整合。

2025-05-24 11:46:31 553

原创 大模型项目实战【建议收藏】,大模型项目实战教程,存下吧很难找全的!

大模型开发是一种以大语言模型为核心的应用开发方式,通过调用API或开源模型,结合Prompt Engineering、数据工程和业务逻辑分解,充分发挥大模型的理解和生成能力,以提供独特功能。与传统AI开发不同,大模型开发更注重工程问题,而非模型本身的优化。传统AI开发需要拆解业务逻辑、训练子模型并形成模型链路,而大模型开发则通过Prompt链路组合实现业务逻辑,将模型训练调优转变为Prompt设计调优。在评估思路上,大模型开发更灵活,直接从业务需求出发,通过小批量验证集和不断优化Prompt来提升泛化效果。

2025-05-23 12:51:05 989

原创 大模型场景应用全览:持续更新,追踪AI最前沿!非常详细!

大模型在多个场景中展现出广泛的应用潜力。在办公场景中,智能办公和智能会议通过文案生成、PPT美化、数据分析、同声传译等功能提升效率。制造场景中,大模型结合EDA、数字孪生等技术,优化研发设计、生产制造和供应链管理。金融场景中,个性化服务、电子营销、欺诈识别和信贷支持等功能提升客户体验和风险管理。医疗场景中,智慧影像、智慧手术和智慧健康助力早期诊断、手术规划和健康管理。政务场景中,政策分析、撰写和管理经验共享提升政策制定和执行效率。大模型产品按部署方式分为云侧和端侧,涵盖通用、行业、手机和PC大模型,推动各行

2025-05-23 12:48:16 1067

原创 从零开始!揭秘大语言模型的训练全过程

Transformer架构是现代大规模预训练模型(如GPT、BERT等)的核心基础。它主要由注意力机制(attention)和前馈神经网络(Feed - forward Network)构成。

2025-05-23 12:42:59 965

原创 LLM之模型高质量微调指南,非常详细收藏这一篇就够!

论文介绍了 KODCODE,这是一个包含 447K 编程问题的合成数据集,每个问题都配有经过验证的解决方案和单元测试。通过一个三步的流水线方法(问题合成、解决方案和测试生成、后训练数据合成),KODCODE 在多样性和质量上都优于现有的代码数据集。

2025-05-23 12:37:34 723

原创 2025年中国人工智能与商业智能发展白皮书|附39页PDF文件下载

随着数据在企业决策中的核心地位日益增强,传统商业智能(BI)工具的局限性逐渐显现,促使人工智能(AI)与BI的融合成为趋势。人工智能与行业智能(ABI)通过结合AI的自动化、智能化能力与BI的数据分析能力,推动商业智能向智能化引擎升级。报告指出,大模型应用呈现爆发式增长,相关岗位需求激增,掌握AI工具的从业者生产效率显著提升。报告还提供了从初阶应用到商业闭环的完整学习路径,帮助从业者快速掌握大模型AI技术,提升竞争力。

2025-05-23 12:34:43 781

原创 什么是大模型微调:我用unsloth将Qwen3大模型微调成脑筋急转弯专家!

今天的Unsloth更适合在硬件资源有限的场景下做微调,它比LLama-Factory更节省GPU显存。一、环境准备1)购买AutoDL云主机(这里之所以选择它,是因为性价比很高,很适合新手做实验),选择3090显卡的即可(如果本地有GPU机器,请用自己的),我购买AutoDL时,选择了PyTorch

2025-05-23 12:31:54 862

原创 DeepSeek医疗革命:基于420余家医院的实证研究,多场景应用深度分析!

1、智能导诊系统  (1)症状分诊与科室匹配(74次)代表医院:东南大学附属中大医院(DeepSeek-R1:671B)(2)院内导航与方言识别(4次)典型案例:顺德第五人民医院(DeepSeek-R1)支持院内导航,支持“肚子像被孙悟空打翻炼丹炉”等生动描述识别

2025-05-23 12:28:53 981

原创 2025最新零基础转行大模型产品经理:从入门到精通的全攻略(附学习路线+实战资源),非常详细收藏这篇就够!

无论是OpenAI的GPT-5、谷歌的Gemini Ultra,还是国内的文心大模型、星火大模型,都在金融、医疗、教育、电商等领域实现了规模化应用。作为连接技术与商业的核心角色,成为企业争抢的“稀缺资源”。

2025-05-22 11:48:38 828

原创 程序员转行做大模型,可以选择下面这些岗位,非常详细收藏我这一篇就够了

文章介绍了大模型领域的五大热门岗位及其职责、要求和适合人群。模型研发工程师负责设计和开发深度学习模型,适合对算法设计有兴趣的程序员;算法工程师将理论算法转化为实际解决方案,适合喜欢解决具体问题的人;数据科学家使用大模型进行数据分析和预测,适合对数据分析感兴趣的程序员;AI产品经理负责AI产品的开发与管理,适合从技术转向管理的人员;机器学习工程师构建和维护机器学习系统,适合有实际项目经验的人。这些岗位覆盖了从技术研发到产品管理的多个领域,为不同背景和兴趣的程序员提供了多样化的职业选择。

2025-05-22 11:44:06 757

原创 大语言模型如何重塑会计行业:应用场景与应对策略

针对数据保密性需求,财务人员可上传样例数据或脱敏数据至大模型,由大模型生成代码后,在本地 Python 编译器等数智化工具中运行,确保数据分析功能与效果的同时,降低数据安全风险。

2025-05-22 11:39:31 960

原创 业界首份《云智算技术白皮书》(2025)发布|附30页PDF文件下载

近日,在2025中国移动云智算大会上,业界首份《云智算技术白皮书》(2025)发布,首次提出下一代云智算体系架构和十大关键技术方向,推动“云计算”向“云智算”升级,带领云计算产业技术革新。白皮书详细阐述了云智算的发展背景、内涵,深入介绍云智算的关键技术方向,为云智算的发展奠定基础。......文│中国移动。

2025-05-22 11:30:12 694

原创 一文读懂!企业 AI 从规划到落地全攻略

AI已成为当前很热的话题,企业都想做AI,或者都在做AI,但有的不知道如何做,即使做了效果也与想象中的千差万别,那么企业该如何正确的做AI?老杨特意组织了一场线上沙龙活动,由某企业AI负责人胡总为来自全国各地的甲方数字化同仁解疑答惑,从项目实施路径的顶层规划,到智能体构建的具体策略;从企业知识库的搭建难题,到 AI 团队的组建方向,每一个话题都紧紧抓住了当下企业在 AI 转型过程中的关键痛点。这场会议,犹如一场及时雨,为在 AI 探索道路上前行的企业提供了宝贵的经验与思路。

2025-05-22 11:28:05 454

原创 40个DeepSeek神级提示词!工作效率提升300%,秒变AI高手!

DeepSeek提示词不是魔法咒语,而是你的"需求解码器"!

2025-05-22 11:25:52 740

原创 非科班逆袭:985学子如何斩获百度大模型offer!

恭喜学员拿下快手大模型offer,可灵大模型部门急招,学员抓住了机会,平时学习时就很注重主动思考,深挖技术细节。面试直接给面试官手绘项目架构图,边画边讲,靠着平时学习时打下的技术和项目深度,成功拿下offer。最近收到训练营学员的捷报!一位训练营同学成功斩获百度大模型算法实习岗,我扒出了他的通关秘籍,为正在备战实习/秋招的同学送上超实用攻略!01主包 top 985 非科班大四,本校保研计划转 AI,因此计划找段日常实习体验一下+丰富经历。

2025-05-22 11:23:20 820

原创 AI产品经理求职圣经:八本必读书籍,助你斩获梦想offer!AI产品经理必读书籍

想要成为一名优秀的人工智能产品经理,选择合适的书籍至关重要。以下是八本推荐书籍,涵盖从基础知识到高级实践的各个方面,帮助构建全面的知识体系:《人工智能:一种现代的方法》:经典之作,适合有技术背景的产品经理,深入讲解人工智能核心理论。《智能web算法》:面向广泛读者,侧重网络数据挖掘和搜索引擎优化,适合关注用户体验的产品经理。《PATTERN RECOGNITION AND MACHINE LEARNING》:深入讲解模式识别和机器学习,适合希望提高AI技术深度的产品经理。《学习opencv》:图像

2025-05-21 11:12:33 928

原创 瞬间对大模型的兴趣达到10000000%,挑战AI巅峰:十本大模型学习秘籍,开启你的深度学习之旅!

本文推荐了十本学习大模型的必读书籍,涵盖了从基础理论到实践应用的多个方面。这些书籍包括《大语言模型:原理与工程实践》、《大模型应用开发极简入门:基于GPT-4和ChatGPT》、《大规模语言模型:从理论到实践》等,适合不同层次的读者,从初学者到高级研究人员和工程师。每本书都详细介绍了大模型的关键技术、应用开发和优化技巧,并提供了丰富的实践指导和代码示例。此外,文章还提供了大模型学习路线、商业化落地方案、视频教程和PDF书籍等资源,帮助读者从零基础到进阶全面掌握大模型技术。无论是想要快速入门还是深入研究,这些

2025-05-21 11:10:00 594

原创 打造专属AI巨兽:100条深度学习秘籍揭秘,大模型训练终极指南!

本文详细介绍了学习与训练大模型的关键步骤和策略。首先,掌握深度学习基础知识和编程技能是必要的,包括神经网络结构、优化算法及常用框架如TensorFlow和PyTorch。其次,数据准备和硬件资源的管理至关重要,大模型需要高质量的数据和强大的计算能力。模型选择、训练、调试和优化是核心环节,需通过超参数调整、正则化技术等手段提升性能。此外,对抗性训练、模型部署和持续学习也是不可忽视的部分。文章还强调了数据增强、自动化工具、分布式训练等高效方法,以及模型解释性、伦理法律问题等实践中的注意事项。通过不断学习、实践和

2025-05-21 11:03:42 928

原创 写给想做大模型算法的你,非常详细收藏这一篇就够了!

【RAG实战-第1天】RAG流程详解与优化方案:案例+代码+图解【RAG实战-第2天】从0-1搭建企业知识库-FastAPI【RAG实战-第3天】前后端服务运行【RAG实战-第4天】代码结构详细解析【RAG实战-第5天】核心代码详解【RAG实战-第6天】RAG评估【RAG实战-第7天】如何写一个有深度RAG项目经历【RAG实战-第8天】实战项目的简历准备、面试、运用(离线解析模块)【RAG实战-第9天】实战项目的简历准备、面试、运用(在线问答模块)

2025-05-21 10:58:09 454

原创 政务大模型的春天,AI办公先萌芽

无疑,尽管当前各地政务部门对DeepSeek的本地化部署如春笋般蓬勃生长,但生机下仍存在应用深度”“地域差异”“使用体验等方面的不足。在智能化办公升级赛道,仅凭DeepSeek,也很难满足各部门的差异化需求。而在大模型落地应用过程中,也存在包括对数据的应用、大模型微调、数据安全隐私保证等问题。这些坎但凡有一个迈不过去,整个办公智能化的路线,就会受阻。通用大模型行业大模型专业大模型的协同作战,盘活数据的弹药库,兼具对AI工具应用的个性化需求,或许才能让“AI。

2025-05-21 10:56:11 953

原创 大模型把业务部门的需求都炸出来了,这下不好办了!

我们部门准备上个大模型,赋能销售签单!"听起来很棒!具体解决销售哪个环节的什么问题?现在痛点有多大?能带来多少明确的签单提升?"呃… 就是… 感觉能提升效率,让销售更智能?这样的对话,你是不是也经常听到?自打大模型火了,空气里就飘着一股"AI 焦虑"。甭管是互联网大厂还是传统企业,老板、业务、技术,人人都怕掉队,纷纷要求"必须搞点大模型"。结果呢?行业里普遍的共识是,AI 项目失败率高得惊人(多家咨询报告如 Gartner, McKinsey 指出趋势,具体数字虽有差异,但失败率高是事实)。

2025-05-21 10:53:26 512

原创 从图灵到AGI:人工智能的“前世今生”与“星辰大海”

在科幻电影中,拥有自我意识、能与人类深度交流甚至共情的AI,曾是我们遥不可及的想象。然而,当AI的机智对答如流,当AI视频生成以假乱真,当AI绘画的绚烂夺目,我们猛然发现,那个曾经只存在于大银幕的未来,正以前所未有的速度向我们奔袭而来。人工智能(AI)究竟是如何一步步走到今天,拥有如此惊人的力量?它又将引领我们走向一个怎样的未来?今天,就让我们一起穿越AI的时光隧道,回顾那些闪耀历史的里程碑,并大胆展望未来可能出现的重大变革。

2025-05-21 10:52:03 629

原创 25年大模型面试必问八股文,背完通过率98%,大模型面试题库大全(含答案):一篇在手,八股文不再愁,面试必备!

随着大模型技术的快速发展,相关岗位在秋招中备受青睐,薪资水平也显著提升。本文汇总了大模型算法岗的常见面试题,涵盖基础和进阶两部分。基础篇包括主流开源模型体系、模型架构、Tokenizer实现方法等;进阶篇则涉及LLMs复读机问题、多模态大模型、长文本处理等。这些内容不仅帮助求职者准备面试,也反映了大模型技术的最新趋势和挑战。

2025-05-20 12:27:03 998

原创 宇宙厂AI产品经理岗,一面面麻了「附答案」,AI产品经理面试宝典:三天速成,一周斩获四大offer!

本文聚焦于AI产品经理面试中的关键问题,涵盖了AI领域的核心技术及其应用。首先,详细解析了Attention机制,包括其定义、流程、作用以及与Transformer中Self-attention的关系。其次,深入探讨了Transformer模型的基本原理、自注意力的优势、Encoder和Decoder的功能、Multi-Head Attention的作用、位置编码以及训练过程。此外,文章还介绍了BERT模型的预训练、优点、输入结构、训练策略及应用场景。最后,简要提及了ChatGPT的训练原理(RLHF)、数

2025-05-20 12:24:22 820

原创 【什么是大模型?】一图掌握大模型全貌:国内外知名大模型及240余家清单揭秘!

在数字时代,数据已成为新的石油,而大数据模型则成为了驱动这一时代变革的关键引擎。那么,什么是大模型?简而言之,大模型是指利用海量数据,通过先进的算法和技术,训练得到的具有强大预测和决策能力的模型。这些模型在诸多领域都展现出了惊人的应用潜力,如自然语言处理、图像识别、金融风控、智能推荐等。

2025-05-20 12:20:33 934

原创 微调推理大模型教程:以Qwen3/DeepSeek-R1为例,掌握核心技巧!

DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型,还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型,在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例,为您介绍如何微调该系列模型。

2025-05-20 12:16:27 1003

原创 DeepSeek-R2展示的400倍推理效能跃升,彻底击穿了西方学界认定的物理极限

传统AI的“摩尔定律”在此刻宣告死亡——DeepSeek R2展示的400倍推理效能跃升,彻底击穿了西方学界认定的物理极限。递归认知晶格架构:抛弃Transformer框架,通过高维数学结构实现“思维维度跃迁”,其核心算法运行在人类尚未命名的数学空间自创数学语言:面对未解难题时,R2能即时发明全新数学分支。某物理学家耗时15年的课题,被其用自创符号系统在数秒内破解算力暴击:1万亿次浮点运算(Teraflop)下推理效率较GPT-5提升400倍,西方测试基准沦为废纸

2025-05-20 12:13:41 640

原创 最新!OpenAI:GPT-5将实现大统一,Codex最佳实践是这样的

Codex发布后,OpenAI Codex在Reddit举行了AMA(Ask Me Anything)活动在这场 1 小时的 AMA 中,Codex 核心研发和研究负责人围绕 :为什么先推云端代理、CLI 为何用 TypeScript、未来多语言绑定与 IDE 插件、GPT-5 与 Operator 的整合、定价与 API 计划、安全沙箱、最佳实践 等问题给出了清晰路线图:Codex-1 目前是「云端沙箱 + ChatGPT 原生入口」的研究预览,面向大仓库 + 测试驱动工作流效果最佳;

2025-05-20 12:08:03 926

原创 DeepSeek-R1 面试题汇总

本文汇总了DeepSeek-R1系列面试题及相关技术内容,涵盖了GRPO算法、DeepSeek-R1-Zero模型、冷启动数据、蒸馏技术、推理导向的强化学习等多个方面。文章还提供了DeepSeek-R1论文解读、模型复现及部署的详细指南,并分享了AI大模型学习路径和资源,旨在帮助读者深入理解并掌握相关技术,提升在AI领域的竞争力。

2025-05-20 12:04:47 638

原创 Ai产品经理修炼手册:爆肝学习路线,一篇文章搞定全程_AI产品经理学习路线,非常详细收藏这一篇就够了!

AIGC(生成式人工智能)领域近期招聘需求旺盛,许多求职者成功转行并获得显著薪资提升。为帮助普通人快速进入AIGC产品经理岗位,本文提供了一套两个月内实现职业转型的实用指南。首先,建议通过行业资讯网站(如新智元、机器之心)和研报平台(如慧博投研、艾瑞)获取最新行业动态。其次,明确AIGC的四大细分领域(文本、图片、音频、视频),并根据个人兴趣和市场需求选择方向,同时搭建个人知识库。接着,系统学习AIGC基础知识,包括深度学习、机器学习算法、计算机视觉、自然语言处理等。最后,通过实战项目(如AI对话机器人和A

2025-05-19 15:56:59 1617

原创 AGI大模型学习路线:(非常详细)AGI大模型学习路线,你要悄悄努力,然后惊艳所有人

学习大模型和AI技术需要从打好基础开始,重点包括数学和编程。数学方面,线性代数、微积分和概率统计是核心内容,推荐课程如Khan Academy和MIT的公开课。编程方面,Python是AI领域的主要语言,需掌握其基础及数据结构与算法,推荐课程如Codecademy和Coursera的相关课程。打好这些基础后,可以进一步入门机器学习,逐步深入AI领域的学习与实践。

2025-05-19 15:51:18 557

原创 无需编码!本地化一站式服务:从数据集准备到模型微调的完整流程!

LLaMA Factory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它,用户可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调。

2025-05-19 15:41:54 850

原创 DeepSeek专题报告之AI+医疗|附39页文件下载

DeepSeek AI的技术优势,将沿着以下四大路径,深刻改变医疗健康产业的格局。1、医疗资源分布式重构。2、制药工业范式革新。3、健康管理服务升级。4、医保支付体系优化。通过深度整合DeepSeek等智能化工具,医生群体有望在工作效率的显著提升与专业技能的持续深耕之间,找到合适的平衡点,最终为每一位患者提供更加优质、更加高效、更加人性化的卓越医疗服务,共同谱写人类健康事业发展的新篇章。......文│民生证券。

2025-05-19 15:20:54 829

原创 在本地部署Qwen3大模型与Dify环境中亲测制作“合同审查智能体”应用

在与多位律师朋友以及自己开公司的老板朋友聊天中发现,他们都有一个迫切的需求:“希望对自己手头的大量合同文本,做一个全面的合同风险评估,提前采取措施规避风险点,或者提前准备以应对风险的爆发,并减少损失。”因此,在私有化部署的大模型与AI应用开发平台中开发本地可用的“合同审查智能体”,就像给企业装了一个既聪明又可靠的“法律秘书”。想象一下,公司的合同就像家里的贵重物品。如果使用网上的大模型和类似DeepSeek、豆包等AI助手,虽然方便,但总担心数据泄密。

2025-05-19 15:19:04 617

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除