自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

人工智能讲师分享前沿技术

人工智能大模型培训老师叶梓分享AI前沿知识

  • 博客(1250)
  • 资源 (1)
  • 收藏
  • 关注

原创 大模型培训讲师叶梓大模型技术、商业图景与趋势培训提纲

深入了解大语言模型的最新发展动态及应用场景。掌握大语言模型在日常工作中的应用方法与技巧。学会利用大语言模型提升工作效率与质量。

2025-03-28 14:12:54 805

原创 人工智能培训讲师叶梓Dify培训:快速构建AI应用的低代码平台讲义

Dify平台的起源与发展历程Dify平台在AI应用开发领域的定位与优势Dify平台的架构与技术原理详解。

2025-03-19 16:30:00 1265

原创 大模型培训讲师叶梓LlamaFactory模型微调培训提纲

叶梓,上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。

2025-03-18 16:15:00 1975

原创 AIGC大模型讲师培训老师叶梓简历及人工智能生成内容(AIGC)技术发展与产业机遇提纲

长期负责城市信息化智能平台的建设工作,开展行业数据的智能化应用研发工作,牵头多个省级、市级行业智能化信息系统的建设,主持设计并搭建多个省级、市级行业大数据平台。研发智能服务系统,包括:元宇宙与虚拟数字人、基于人工智能的内容生成(AIGC)、基于NLP技术的对话系统、基于深度学习的图像识别系统、基于智能推理的行业推荐系统。为解决超量数据的存储与计算的问题,搭建了存储全市数据的云计算平台,并在其上进行了基于大数据的分析和挖掘工作。作为项目总负责,负责项目管理、产品研发、系统分析、技术指导、算法指导等。

2024-09-18 16:13:35 1062

原创 人工智能大模型讲师培训老师叶梓介绍及多模态大模型原理与实践提纲

通过本次培训,拓展对多模态AI应用领域的视野,帮助团队聚焦AI赋能创新突破,提升对AI服务的技术认知与理解,更好地助力业务智能化业务建设。

2024-07-12 16:00:00 906

原创 人工智能培训讲师咨询叶梓介绍及智能医疗技术与ChatGPT临床应用三日深度培训提纲

叶梓,上海交通大学计算机专业博士毕业,高级工程师。主研方向:数据挖掘、机器学习、人工智能。历任国内知名上市IT企业的AI技术总监、资深技术专家,市级行业大数据平台技术负责人。长期负责城市信息化智能平台的建设工作,开展行业数据的智能化应用研发工作,牵头多个省级、市级行业智能化信息系统的建设,主持设计并搭建多个省级、市级行业大数据平台。参与国家级人工智能课题,牵头上海市级人工智能示范应用课题研究。

2024-05-08 16:11:22 1172

原创 人工智能讲师AI讲师大模型讲师叶梓简历及大语言模型技术原理与实践提纲

本课程旨在通过实际案例展示ChatGPT、ChatGLM、Langchain等相关大语言模型的具体应用场景及实践技巧,从而帮助学习者深入了解和掌握大语言模型的概念和更广泛的应用,深入理解其工作方式,包括其基础知识、核心算法和实现方式,掌握其在各行业领域中的应用情况等。该课程适合于对大语言模型技术感兴趣的学习者,从初学者到进阶者均可受益。经过本课程的学习,获得相关技术实战经验,通过一系列的实践案例提高利用大模型解决实际问题能力。

2024-02-21 16:30:38 1929

原创 AI人工智能大模型讲师叶梓简历及《基于人工智能的内容生成(AIGC)理论与实践》培训提纲

本课程介绍了chatGPT相关模型的具体案例实践,通过实操更好的掌握chatGPT的概念与应用场景,可以作为chatGPT领域学习者的入门到进阶级课程。1、指示学习(Instruct Learning)6、Batch Norm与Layer Norm。2、Transformer中的block。1、你需要的仅仅是“注意力”7、chatGPT的应用领域。8、chatGPT引发的讨论。5、位置编码(抛弃RNN)4、从人类反馈中RL的思路。3、有监督微调(SFT)5、奖励建模(RM)

2023-12-30 13:26:21 1194

原创 人工智能AIGC培训讲师叶梓简历及AI强化学习培训提纲

强化学习是当前最热门的研究方向之一,广泛应用于机器人学、电子竞技等领域。本课程系统性的介绍了强化学习(深度强化学习)的基本理论和关键算法,包括:马尔科夫决策过程、动态规划法、蒙特卡罗法、时间差分法、值函数逼近法,策略梯度法等;以及该领域的最新前沿发展,包括:DQN及其变种、信赖域系方法、Actor-Critic类方法、多Agent深度强化学习等;同时也介绍大量的实际案例,包括深度强化学习中最著名的工程应用:Alpha Go。

2023-12-06 14:16:05 1707

原创 人工智能ai大模型培训师专家讲师叶梓介绍及ChatGPT提纲

叶梓,长期负责城市信息化智能平台的建设工作,牵头多个省级、市级智能化信息系统的建设,主持设计并搭建多个行业省级、市级大数据平台。参与国家级行业人工智能课题研究,牵头市级行业人工智能课题(智能化医疗产品、智能化场景应用)研究。带领团队在相关行业领域研发多款人工智能创新产品,成功落地多项大数据、人工智能前沿项目。参与国家级、省级大数据技术标准的制定,曾获省部级以上的科技创新一等奖。8、chatGPT的应用领域。9、chatGPT引发的讨论。2、 GPT的内部架构。5、 GPT的应用场景。6、奖励建模(RM)

2023-03-25 16:42:58 2833

原创 AI工智能讲师叶梓培训简历及提纲:AI人工智能之基于人工智能的内容生成(AIGC)简历提纲

AIGC并不是一个全新的概念,它最早出现在深度学习模型“对抗生成网络”GAN的应用中,被誉为“21世纪最强大的算法模型之一” ,后续发展起来的扩散模型,以及自然语言领域BERT、GPT等都是典型的AIGC模型。

2023-02-05 20:25:56 1595

原创 大数据人工智能培训讲师老师:叶梓简介 人工智能讲师ai讲师大数据讲师人工智能老师

上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。毕业后即进入某大型软件上市公司从事大数据、人工智能等技术相关工作,曾先后作为技术经理或总工程师,负责大型信息平台、市级信息平台的建设工作,并参与省级信息平台的建设;主持制定了包括多份信息化工程标准。在大数据应用、人工智能等方面都有着丰富的经验。个人助理QQ:526346584案例及课程:主要课程:《数据分...

2019-09-11 09:45:18 12044 1

原创 人工智能兼职讲师ai讲师强化学习讲师叶梓老师《强化学习》课程介绍及提纲

2018年11月29日,叶梓老师在线直播课《强化学习》第一期正式开班。这是人工智能之机器学习中除深度学习之外另一门经典课程,是AI必修之课。人工智能的重要领域——强化学习当前的机器学习算法可以分为3种:有监督的学习(Supervised Learning)、无监督的学习(Unsupervised Learning)和强化学习(Reinforcement Learning)...

2018-12-27 10:39:34 1308 1

原创 AI兼职讲师人工智能兼职讲师叶梓老师 机器学习与深度学习培训提纲

课程时长】6天(6小时/天)【课程简介】人工智能的浪潮正在席卷全球,各种培训课程应运而生,但真正能让学员系统、全面掌握人工智能深度学习知识点,并且能学以致用的实战课程并不多见。本课程包含机器学习、深度学习的重要概念及常用算法(决策树、关联规则、聚类、贝叶斯网络、神经网络、支持向量机、隐马尔科夫模型、遗传算法、CNN、RNN、GAN等),以及人工智能领域当前的热点。通过6天的系...

2018-12-27 10:36:10 1248 1

原创 AI开始改写自己的进化规则:Meta超智能体研究解析

《超智能体:让AI学会自我进化的革命性突破》 最新研究提出"超智能体"架构,突破传统AI改进限制。该系统包含两个核心组件:执行任务的任务智能体和负责改进机制的元智能体。通过让元智能体不仅能优化任务执行,还能升级自身的改进算法,实现了"元认知自我修改"能力。

2026-03-27 17:52:19 216

原创 人工智能讲师叶梓:大模型强化学习训练框架EasyR1 训练流程详解

本文详细介绍了EasyR1训练框架的执行流程,包含启动、初始化、Rollout、奖励计算、更新及验证保存等关键阶段。框架通过Ray分布式系统实现并行处理,采用vLLM生成响应,结合PPO算法进行模型优化。具体包括:1)命令行参数解析和Ray初始化;2)分词器、数据加载器、Worker组和奖励管理器的创建;3)vLLM生成响应序列;4)多阶段奖励和价值计算;5)基于FSDP的梯度更新;6)周期性验证和检查点保存。整个流程支持多GPU并行计算,提供从数据准备到模型训练的全流程解决方案。

2026-03-25 14:07:42 602

原创 Fast-WAM:重构 WAMs 的效率与性能平衡

清华大学团队提出Fast-WAM方法,创新性地解决了世界动作模型(WAMs)在实时控制中的两大难题。该方法通过保留训练阶段的视频建模但移除推理时的显式未来生成,在保持性能的同时将延迟降至190ms,比传统方案提速4倍以上。

2026-03-24 20:36:32 418

原创 多跳推理救场!阿里 & 清华推出 HopChain,让视觉大模型告别 “看图瞎猜”

阿里巴巴与清华团队提出HopChain框架,通过结构化多跳推理数据合成方法解决视觉语言模型(VLM)长思维链推理中的错误叠加问题。该框架构建逻辑依赖的实例链,强制模型每一步依赖视觉证据,在24个基准测试中平均提升20项性能,长思维链场景下精度提升超50%。实验证明多跳结构对增强VLM的细粒度推理与泛化能力具有关键作用,均衡修正了感知、推理等各类错误。该研究为提升VLM的视觉接地能力提供了新思路。

2026-03-23 20:29:12 215

原创 大模型 RLVR 训练真相:没学会新推理,只是更会 “抄作业”

清华大学与上海交通大学团队研究发现,可验证奖励强化学习(RLVR)并未提升大模型的推理能力上限。论文通过数学、代码生成和视觉推理三大领域的实验证明,RLVR仅优化了采样效率,使模型更易选中基础模型已有的正确推理路径,却牺牲了探索能力,导致推理边界收缩。实验显示,当采样次数增加时,基础模型表现反超RLVR模型,且RLVR模型能解的题目均为基础模型的子集。研究表明,RLVR并非推理能力的进化手段,而是答题效率的优化工具,现有RL算法均无法突破这一局限。

2026-03-23 19:57:29 273

原创 DeepSeek-Coder:开源代码大模型逆袭,性能碾压 GPT-3.5

摘要:DeepSeek-Coder系列开源代码模型突破闭源垄断,采用2万亿tokens高质量训练数据,支持1.3B-33B参数规模。创新性引入16K长上下文窗口和FIM填空任务,在HumanEval等基准测试中超越Codex等闭源模型。33B版本性能接近GPT-4,7B版本也优于CodeLlama-33B。V2版本扩展至128K上下文和338种语言,HumanEval准确率达93.2%。该模型支持商业应用,可显著提升开发效率并降低成本。

2026-03-20 19:30:00 207

原创 120B 数学语料 + GRPO 算法,DeepSeekMath 刷新开源大模型推理天花板

摘要:DeepSeekMath大模型通过创新方法显著提升了开源模型的数学推理能力。研究团队从CommonCrawl挖掘出120B tokens的数学内容构建DeepSeekMathCorpus数据集,其性能远超现有数据集。模型采用代码预训练初始化,结合新型GRPO强化学习算法(省去价值模型,降低训练成本),在多个数学基准测试中表现优异:7B参数的DeepSeekMath在MATH基准达到36.2%准确率,超越540B的Minerva;经GRPO优化后,GSM8K准确率提升至88.2%。研究还发现arXiv数

2026-03-20 15:05:48 376

原创 FaithLens:8B 参数大模型幻觉检测器,性能超 GPT-4.1 且低成本可解释

摘要:清华大学、复旦大学等机构提出FaithLens模型,解决大模型生成内容中的"忠诚度幻觉"问题。该模型通过高质量数据训练和强化学习优化,在检测幻觉的同时提供清晰解释,支持摘要、RAG等多种任务。实验表明,8B参数的FaithLens在跨任务场景中表现优于GPT-4等大模型,解释质量得分90.4,推理成本仅0.1美元/1.2K样本,数据利用率高。消融实验验证了数据过滤和强化学习的关键作用。项目开源在GitHub,论文发布于arXiv。

2026-03-19 16:49:28 390

原创 AI拐点已定:2026年,参数竞赛凉了,“能干活”才是王炸

如果说巨头的战略转向是行业的“风向标”,那么2026年初横空出世的OpenClaw(开源跨平台轻量级智能体工作流框架),则用现象级热度,直接定义了“能干活的AI”该有的样子,也为行业转向提供了最直观的落地参考。与传统聊天机器人(Chatbot)仅能实现文本生成、问答交互的“被动响应”不同,OpenClaw作为一款AI智能体(Agent),其核心突破在于实现了“理解指令→自主规划→调用工具→执行任务→交付结果”的全闭环,真正从“能说”走向“能干”。

2026-03-19 13:44:12 356

原创 英伟达入局OpenClaw改写智能体产业格局

2026年英伟达GTC大会聚焦OpenClaw开源项目,黄仁勋称其为"AI下一个前沿"。英伟达推出NemoClaw工具链和VeraRubin算力平台,解决OpenClaw高算力需求和安全问题,推动其从极客项目向企业级应用转型。这一布局使英伟达掌握智能体时代话语权,股价应声上涨1.65%。分析指出,未来智能体产业将围绕开源生态、算力支撑和安全标准展开,同时面临商业与开源平衡等挑战。OpenClaw与物理AI的融合也拓展了应用边界,印证了智能体市场的巨大潜力。

2026-03-18 16:10:00 195

原创 另类视角看待OpenClaw:不止是工具,更是AI架构的反思

OpenClaw:架构革命下的AI执行新时代 OpenClaw并非简单的效率工具,而是通过"思考与执行分离"的架构创新,实现了AI从参谋到执行者的跨越。其开源调度内核可兼容不同大模型和工具,支持企业级全流程自动化。这种开放架构赋予用户自由定制权,但同时也带来权限与安全的核心争议。OpenClaw的出现标志着AI竞争正从"智商比拼"转向"落地能力"较量,推动行业进入"执行时代"。其价值不仅在于自动化效率,更在于重构人机协作模式,但

2026-03-17 12:57:19 303

原创 人工智能培训讲师叶梓:OpenClaw 两日实战培训提纲

OpenClaw两日实战提纲

2026-03-17 12:13:24 832

原创 大模型讲师叶梓:大模型2026最新应用技术培训提纲(包含Openclaw实战)

本次技术培训聚焦大模型与RAG全栈技术。

2026-03-15 16:23:56 312

原创 人工智能培训讲师叶梓:OpenClaw龙虾 AI 安装教程(2026 最新・全平台)

OpenClaw(龙虾AI)跨平台安装指南(Win/macOS/Linux/Docker)包含一键脚本、手动安装及常见问题解决方案。

2026-03-15 16:03:22 548

原创 OpenCLAW 讲师叶梓OpenCLAW 技术培训提纲

OpenCLAW 是一款开源的AI智能体,由彼得·斯坦伯格开发,核心定位是“可执行、可定制的数字助理”,区别于传统仅能对话的AI,它能真正落地执行各类任务,是企业降本增效、个人提升效率的实用工具,也是本次培训的核心内容载体。

2026-03-12 16:58:38 614

原创 大模型讲师数据治理讲师叶梓《高质量数据集与大模型应用技术》培训提纲

《高质量数据集与大模型应用技术》培训提纲

2025-11-05 12:30:00 1049

原创 人工智能讲师数据治理讲师叶梓《数字化转型与大模型技术应用培训提纲》

叶梓,工学博士,高级工程师。2005年上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。毕业后即进入软件行业从事信息化技术相关工作;负责或参与了多项国家级、省市级人工智能及大数据项目的建设工作。在人工智能和大数据应用等方面都有着丰富的经验。

2025-11-04 19:35:38 738

原创 字节跳动联合港大推出 Mini-o3!专治 AI 视觉推理 “没耐心”,训练 6 轮能推理几十步

字节跳动与中国香港大学推出开源模型 Mini-o3,专治 AI 视觉推理 “短视病”!传统模型遇复杂图像搜索就卡壳,而它训练仅 6 轮,就能实现数十轮推理,像人类拆题般层层突破;专攻高难度任务,在精密图像分析中,准确率更是登顶开源模型榜首。

2025-09-17 20:45:00 811

原创 用文字、图片和音频“拼”出一个视频!HuMo教你如何做到

字节跳动联手清华大学开源多模态视频生成神器——HuMo!它凭一张图、一段文字、一段音频,就能轻松生成电影级效果的说话视频,彻底解决了传统技术中人物身份不一致、声音画面不同步的老大难问题

2025-09-17 14:00:00 900

原创 清华GUAVA:一张照片就能搞定3D人,效率逆天

清华团队开源GUAVA技术,仅凭一张图,0.1秒就能生成超逼真3D化身!身份一致、表情精准,还能实时驱动,渲染流畅自然。这大幅降低了创作门槛,影视、直播等行业将迎来新变革!

2025-09-10 15:06:44 1182

原创 大模型写的软件好不好用?这个自动点一点的测评框架,准头比人还高

MetaGPT推出RealDevWorld,这款自动化测试工具,用中文描述需求即可生成测试用例,免去繁琐操作。自愈脚本、动态环境感知等功能,精准应对复杂场景,效率大幅提升。它覆盖多平台测试,单次成本仅0.26美元,还与主流工具无缝集成。

2025-09-04 16:08:11 827

原创 MobileCLIP2:优化多模态强化训练,实现低延迟下的图像文本模型性能突破

Apple团队提出MobileCLIP2模型,通过改进多模态强化训练框架,在低延迟场景下显著提升图像文本任务性能。核心创新包括:采用更优质的DFN-5B基础数据集,使ImageNet-1k精度提升1.4%;使用DFN预训练的教师模型集合,精度提升2.8%;优化CoCa生成器实现两阶段训练。新增五阶段混合架构MCi3/MCi4,在1024×1024分辨率下延迟降至1/7.1。

2025-09-03 20:30:00 1107

原创 FastVLM:高效视觉编码助力视觉语言模型突破高分辨率效率瓶颈

Apple 团队提出 FastVLM 模型,其核心创新在于引入新型混合视觉编码器 FastViTHD,通过优化视觉编码流程与 token 生成机制,在无需额外 token 修剪操作的前提下,仅通过缩放输入图像即可实现分辨率、延迟与精度的最优权衡。

2025-09-03 16:07:53 1182

原创 腾讯混元开源视频拟音模型,破解 AI 视频 “无声” 难题

腾讯混元开源视频音效生成模型“HunyuanVideo-Foley”,解决了AI视频缺乏音效的难题。用户只需输入视频和文字描述,模型即可智能匹配电影级音效,实现“音画同步”。该模型依托10万小时音视频数据训练,能够精准解析视觉内容与语义信息,自动生成环境音、动作音和背景音乐。

2025-08-28 16:46:51 690

原创 人工智能培训讲师叶梓分享前沿论文:应对奖励噪声挑战,提升大模型推理鲁棒性

在现实世界强化学习应用场景中,大模型面临的奖励噪声问题显著影响其推理能力。本研究创新性提出推理模式奖励(RPR)结合奖励模型(RMs)校准策略,提升大模型在高噪声环境下的推理鲁棒性。

2025-08-26 12:30:00 789

原创 人工智能培训讲师叶梓:大模型应用工具dify实战分享

Dify是一款开源的大模型应用开发平台,旨在简化和加速生成式AI应用的创建和部署。

2025-08-20 15:30:00 789

Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册(All)_ZCX

叶梓老师整理的Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册,非常实用

2018-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除