- 博客(1233)
- 资源 (1)
- 收藏
- 关注

原创 大模型培训讲师叶梓大模型技术、商业图景与趋势培训提纲
深入了解大语言模型的最新发展动态及应用场景。掌握大语言模型在日常工作中的应用方法与技巧。学会利用大语言模型提升工作效率与质量。
2025-03-28 14:12:54
740

原创 人工智能培训讲师叶梓Dify培训:快速构建AI应用的低代码平台讲义
Dify平台的起源与发展历程Dify平台在AI应用开发领域的定位与优势Dify平台的架构与技术原理详解。
2025-03-19 16:30:00
1095

原创 大模型培训讲师叶梓LlamaFactory模型微调培训提纲
叶梓,上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。
2025-03-18 16:15:00
1807

原创 AIGC大模型讲师培训老师叶梓简历及人工智能生成内容(AIGC)技术发展与产业机遇提纲
长期负责城市信息化智能平台的建设工作,开展行业数据的智能化应用研发工作,牵头多个省级、市级行业智能化信息系统的建设,主持设计并搭建多个省级、市级行业大数据平台。研发智能服务系统,包括:元宇宙与虚拟数字人、基于人工智能的内容生成(AIGC)、基于NLP技术的对话系统、基于深度学习的图像识别系统、基于智能推理的行业推荐系统。为解决超量数据的存储与计算的问题,搭建了存储全市数据的云计算平台,并在其上进行了基于大数据的分析和挖掘工作。作为项目总负责,负责项目管理、产品研发、系统分析、技术指导、算法指导等。
2024-09-18 16:13:35
936

原创 人工智能大模型讲师培训老师叶梓介绍及多模态大模型原理与实践提纲
通过本次培训,拓展对多模态AI应用领域的视野,帮助团队聚焦AI赋能创新突破,提升对AI服务的技术认知与理解,更好地助力业务智能化业务建设。
2024-07-12 16:00:00
800

原创 人工智能培训讲师咨询叶梓介绍及智能医疗技术与ChatGPT临床应用三日深度培训提纲
叶梓,上海交通大学计算机专业博士毕业,高级工程师。主研方向:数据挖掘、机器学习、人工智能。历任国内知名上市IT企业的AI技术总监、资深技术专家,市级行业大数据平台技术负责人。长期负责城市信息化智能平台的建设工作,开展行业数据的智能化应用研发工作,牵头多个省级、市级行业智能化信息系统的建设,主持设计并搭建多个省级、市级行业大数据平台。参与国家级人工智能课题,牵头上海市级人工智能示范应用课题研究。
2024-05-08 16:11:22
1092

原创 人工智能讲师AI讲师大模型讲师叶梓简历及大语言模型技术原理与实践提纲
本课程旨在通过实际案例展示ChatGPT、ChatGLM、Langchain等相关大语言模型的具体应用场景及实践技巧,从而帮助学习者深入了解和掌握大语言模型的概念和更广泛的应用,深入理解其工作方式,包括其基础知识、核心算法和实现方式,掌握其在各行业领域中的应用情况等。该课程适合于对大语言模型技术感兴趣的学习者,从初学者到进阶者均可受益。经过本课程的学习,获得相关技术实战经验,通过一系列的实践案例提高利用大模型解决实际问题能力。
2024-02-21 16:30:38
1757

原创 AI人工智能大模型讲师叶梓简历及《基于人工智能的内容生成(AIGC)理论与实践》培训提纲
本课程介绍了chatGPT相关模型的具体案例实践,通过实操更好的掌握chatGPT的概念与应用场景,可以作为chatGPT领域学习者的入门到进阶级课程。1、指示学习(Instruct Learning)6、Batch Norm与Layer Norm。2、Transformer中的block。1、你需要的仅仅是“注意力”7、chatGPT的应用领域。8、chatGPT引发的讨论。5、位置编码(抛弃RNN)4、从人类反馈中RL的思路。3、有监督微调(SFT)5、奖励建模(RM)
2023-12-30 13:26:21
1084

原创 人工智能AIGC培训讲师叶梓简历及AI强化学习培训提纲
强化学习是当前最热门的研究方向之一,广泛应用于机器人学、电子竞技等领域。本课程系统性的介绍了强化学习(深度强化学习)的基本理论和关键算法,包括:马尔科夫决策过程、动态规划法、蒙特卡罗法、时间差分法、值函数逼近法,策略梯度法等;以及该领域的最新前沿发展,包括:DQN及其变种、信赖域系方法、Actor-Critic类方法、多Agent深度强化学习等;同时也介绍大量的实际案例,包括深度强化学习中最著名的工程应用:Alpha Go。
2023-12-06 14:16:05
1585

原创 人工智能ai大模型培训师专家讲师叶梓介绍及ChatGPT提纲
叶梓,长期负责城市信息化智能平台的建设工作,牵头多个省级、市级智能化信息系统的建设,主持设计并搭建多个行业省级、市级大数据平台。参与国家级行业人工智能课题研究,牵头市级行业人工智能课题(智能化医疗产品、智能化场景应用)研究。带领团队在相关行业领域研发多款人工智能创新产品,成功落地多项大数据、人工智能前沿项目。参与国家级、省级大数据技术标准的制定,曾获省部级以上的科技创新一等奖。8、chatGPT的应用领域。9、chatGPT引发的讨论。2、 GPT的内部架构。5、 GPT的应用场景。6、奖励建模(RM)
2023-03-25 16:42:58
2759

原创 AI工智能讲师叶梓培训简历及提纲:AI人工智能之基于人工智能的内容生成(AIGC)简历提纲
AIGC并不是一个全新的概念,它最早出现在深度学习模型“对抗生成网络”GAN的应用中,被誉为“21世纪最强大的算法模型之一” ,后续发展起来的扩散模型,以及自然语言领域BERT、GPT等都是典型的AIGC模型。
2023-02-05 20:25:56
1502

原创 大数据人工智能培训讲师老师:叶梓简介 人工智能讲师ai讲师大数据讲师人工智能老师
上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。毕业后即进入某大型软件上市公司从事大数据、人工智能等技术相关工作,曾先后作为技术经理或总工程师,负责大型信息平台、市级信息平台的建设工作,并参与省级信息平台的建设;主持制定了包括多份信息化工程标准。在大数据应用、人工智能等方面都有着丰富的经验。个人助理QQ:526346584案例及课程:主要课程:《数据分...
2019-09-11 09:45:18
11882
1

原创 人工智能兼职讲师ai讲师强化学习讲师叶梓老师《强化学习》课程介绍及提纲
2018年11月29日,叶梓老师在线直播课《强化学习》第一期正式开班。这是人工智能之机器学习中除深度学习之外另一门经典课程,是AI必修之课。人工智能的重要领域——强化学习当前的机器学习算法可以分为3种:有监督的学习(Supervised Learning)、无监督的学习(Unsupervised Learning)和强化学习(Reinforcement Learning)...
2018-12-27 10:39:34
1257
1

原创 AI兼职讲师人工智能兼职讲师叶梓老师 机器学习与深度学习培训提纲
课程时长】6天(6小时/天)【课程简介】人工智能的浪潮正在席卷全球,各种培训课程应运而生,但真正能让学员系统、全面掌握人工智能深度学习知识点,并且能学以致用的实战课程并不多见。本课程包含机器学习、深度学习的重要概念及常用算法(决策树、关联规则、聚类、贝叶斯网络、神经网络、支持向量机、隐马尔科夫模型、遗传算法、CNN、RNN、GAN等),以及人工智能领域当前的热点。通过6天的系...
2018-12-27 10:36:10
1167
1
原创 字节跳动联合港大推出 Mini-o3!专治 AI 视觉推理 “没耐心”,训练 6 轮能推理几十步
字节跳动与中国香港大学推出开源模型 Mini-o3,专治 AI 视觉推理 “短视病”!传统模型遇复杂图像搜索就卡壳,而它训练仅 6 轮,就能实现数十轮推理,像人类拆题般层层突破;专攻高难度任务,在精密图像分析中,准确率更是登顶开源模型榜首。
2025-09-17 20:45:00
589
原创 用文字、图片和音频“拼”出一个视频!HuMo教你如何做到
字节跳动联手清华大学开源多模态视频生成神器——HuMo!它凭一张图、一段文字、一段音频,就能轻松生成电影级效果的说话视频,彻底解决了传统技术中人物身份不一致、声音画面不同步的老大难问题
2025-09-17 14:00:00
552
原创 清华GUAVA:一张照片就能搞定3D人,效率逆天
清华团队开源GUAVA技术,仅凭一张图,0.1秒就能生成超逼真3D化身!身份一致、表情精准,还能实时驱动,渲染流畅自然。这大幅降低了创作门槛,影视、直播等行业将迎来新变革!
2025-09-10 15:06:44
917
原创 大模型写的软件好不好用?这个自动点一点的测评框架,准头比人还高
MetaGPT推出RealDevWorld,这款自动化测试工具,用中文描述需求即可生成测试用例,免去繁琐操作。自愈脚本、动态环境感知等功能,精准应对复杂场景,效率大幅提升。它覆盖多平台测试,单次成本仅0.26美元,还与主流工具无缝集成。
2025-09-04 16:08:11
698
原创 MobileCLIP2:优化多模态强化训练,实现低延迟下的图像文本模型性能突破
Apple团队提出MobileCLIP2模型,通过改进多模态强化训练框架,在低延迟场景下显著提升图像文本任务性能。核心创新包括:采用更优质的DFN-5B基础数据集,使ImageNet-1k精度提升1.4%;使用DFN预训练的教师模型集合,精度提升2.8%;优化CoCa生成器实现两阶段训练。新增五阶段混合架构MCi3/MCi4,在1024×1024分辨率下延迟降至1/7.1。
2025-09-03 20:30:00
917
原创 FastVLM:高效视觉编码助力视觉语言模型突破高分辨率效率瓶颈
Apple 团队提出 FastVLM 模型,其核心创新在于引入新型混合视觉编码器 FastViTHD,通过优化视觉编码流程与 token 生成机制,在无需额外 token 修剪操作的前提下,仅通过缩放输入图像即可实现分辨率、延迟与精度的最优权衡。
2025-09-03 16:07:53
1054
原创 腾讯混元开源视频拟音模型,破解 AI 视频 “无声” 难题
腾讯混元开源视频音效生成模型“HunyuanVideo-Foley”,解决了AI视频缺乏音效的难题。用户只需输入视频和文字描述,模型即可智能匹配电影级音效,实现“音画同步”。该模型依托10万小时音视频数据训练,能够精准解析视觉内容与语义信息,自动生成环境音、动作音和背景音乐。
2025-08-28 16:46:51
530
原创 人工智能培训讲师叶梓分享前沿论文:应对奖励噪声挑战,提升大模型推理鲁棒性
在现实世界强化学习应用场景中,大模型面临的奖励噪声问题显著影响其推理能力。本研究创新性提出推理模式奖励(RPR)结合奖励模型(RMs)校准策略,提升大模型在高噪声环境下的推理鲁棒性。
2025-08-26 12:30:00
690
原创 摆脱固定分词!AU-Net 通杀多任务,性能全面超越 BPE 基线
FAIR at Meta团队提出自回归U-Net(AU-Net)架构,突破传统BPE分词限制。
2025-07-24 12:45:00
1320
原创 UnifiedReward-Think:通过长链推理提升多模态奖励模型性能
UnifiedReward-Think,一种通过强化微调实现的统一多模态链式思考奖励模型。它通过引入长链推理(CoT)来提升视觉理解与生成任务中奖励信号的准确性。
2025-07-07 11:30:00
718
原创 Weak-to-Strong Decoding:低成本提升大模型人类偏好对齐能力,避免“对齐税”难题
该方法利用小模型生成优质开头,大模型延续后续内容,并设计了自动切换机制。实验显示WSD在AlpacaEval2等基准上表现优异,且不影响数学/代码等下游任务性能,反而有所提升。研究还发现解码初期风格化对偏好对齐至关重要,同时该方法具有时间效率高、模型容量可扩展等优势。相关资源和代码已开源。
2025-07-03 11:00:00
1740
原创 符号回归新突破:DrSR 框架助力科学方程发现
符号回归作为一种从数据中发现可解释数学表达式的基本工具,在科学和工程领域具有广泛应用。然而,现有的基于大模型的方法,如 LLM-SR,往往过度依赖大模型内部的先验知识,缺乏对数据结构的深入理解和系统反思机制,导致生成的方程准确性和泛化能力有限。为了解决这些问题,中国科学院自动化研究所的研究人员提出了 DrSR(Dual Reasoning Symbolic Regression)框架,通过结合数据驱动的洞察和归纳思想提取,显著提升了符号回归的效率和准确性。
2025-07-01 15:18:11
1003
原创 TCPA:轻量级可插拔模块,提升视觉提示学习效能
TCPA模块,解决现有视觉提示技术中token交互同质化问题。该模块通过动态匹配不同提示进行注意力交互,仅增加3%计算成本即显著提升特征多样性。实验表明TCPA可使多种高效微调方法性能提升0.2%-3.1%,其轻量可插拔特性适合边缘部署。
2025-07-01 11:30:00
1598
原创 用 ReSearch 框架提升大模型推理与搜索结合能力
ReSearch 框架通过强化学习的方式,使大模型能够在没有推理步骤监督数据的情况下,学会如何在推理过程中合理地进行搜索操作。
2025-06-26 14:58:14
668
原创 ProtoReasoning:为大模型推理能力的提升注入新动力
字节跳动推出ProtoReasoning框架,专为攻克大模型泛化难题。其原型推理能力突出,可高效处理小样本学习任务,降低知识迁移难度。创新算法助力模型快速适应新任务、精准判断,且在多场景中表现出色稳定。
2025-06-26 11:30:00
715
原创 Pixel3DMM:基于单张图像实现 3D 人脸重建的创新技术
Huggingface上线Pixel3dmm,单张照片即可生成高精度三维人脸! 该技术精准还原面部细节与复杂表情,多角度处理表现出众。创新算法驱动下,模型重建效率跃升90%,为影视、游戏、医疗等领域带来高效逼真的三维建模体验。
2025-06-17 10:30:00
826
原创 Meta 发布 V-JEPA 2,智能体的“物理觉醒”
在人工智能的发展历程中,理解物理世界一直是一个巨大的挑战。Meta首席科学家杨立昆团队开源V-JEPA 2世界模型,打破传统AI对语言训练的依赖,为 AI 智能体的物理理解带来了新的曙光,唤醒了智能体对物理世界的 “感知”。
2025-06-13 12:30:00
1026
原创 PPTAGENT:让PPT生成更智能
PPT作为一种常见的展示工具,其制作往往需要耗费大量时间和精力。然而,随着人工智能技术的发展,尤其是大模型的出现,这一状况有望得到改善。PPTAGENT,一个基于大模型的PPT生成工具,正在改变这一局面。
2025-06-04 21:18:50
1458
1
原创 Fast-dLLM:为扩散大模型按下加速键
基于扩散的大型语言模型(Diffusion LLMs)因其独特的非自回归文本生成方式而备受关注。然而,这些模型在实际应用中面临着一个棘手的问题:推理速度远远落后于传统的自回归模型。这主要是因为它们无法像自回归模型那样利用关键的键值(KV)缓存来加速推理,同时在同时解码多个标记时,生成质量也会显著下降。为了解决这一难题,研究人员们提出了 Fast-dLLM,这是一种无需训练即可加速扩散大模型的方法。
2025-06-04 12:07:32
1071
原创 多模态大模型:开启智能决策的新时代
在人工智能的广阔领域中,大模型正以其强大的语言生成和理解能力,成为推动技术进步的关键力量。然而,随着应用场景的日益复杂,仅依赖单一模态(如纯文本)的大模型已难以满足需求。于是,多模态大模型应运而生,它们能够融合多种数据类型,如文本、图像、音频和视频,从而实现更全面的感知和更精准的决策。
2025-05-29 16:58:48
923
原创 超强开源数字人 HunyuanVideo-Avatar一张照片+一段音频,自动识别场景和情感
腾讯推出的HunyuanVideo-Avatar模型通过三大创新技术解决了虚拟角色动画的关键难题:1)人物图像注入模块实现角色动作自然度与一致性的平衡;2)音频情感模块精准对齐音频情感与面部表情;3)面部感知音频适配器支持多角色独立互动。实验证明,该方法在视频质量、情感表达等方面显著优于现有技术。尽管还存在依赖情感参考图像、生成速度较慢等局限,但该模型已为虚拟角色注入前所未有的生命力,相关代码和技术报告已开源。
2025-05-29 11:30:00
1757
原创 模仿医学专家思维的Citrus:助力医疗决策支持
在医疗领域,决策支持一直是备受关注的课题。近年来,大模型技术的快速发展为这一领域带来了新的机遇。《Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support》论文介绍了一种名为Citrus的医疗语言模型,它通过模仿医学专家的认知过程,为医疗决策支持提供了新思路。
2025-05-22 19:30:00
1608
原创 大模型讲师叶梓培训提纲《基于知识库的大模型应用》
2005年上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。毕业后即进入软件行业从事信息化技术相关工作;负责或参与了多项国家级、省市级人工智能及大数据项目的建设工作。在人工智能和大数据应用等方面都有着丰富的经验。
2025-05-22 14:34:21
1108
Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册(All)_ZCX
2018-12-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人