自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 多模态大语言模型现状

MM IT是一种使用指令格式化的数据微调预训练的MM-LLMs的方法,通过这个过程,MM-LLMs可以泛化到未见过的任务,从而提高零击性能。此外,我们审查了选定的MM-LLM在主流基准上的性能,并总结了增强MM-LLM潜力的关键训练配方。总结了MM-LLM的现有趋势,包括从专注于MM理解到特定模式的生成,从MM预训练到SFT和RLHF,并采用更有效的模型架构。在过去的一年中,多模态大型语言模型(MM-LLMs)取得了实质性的进步,通过成本效益良好的训练策略增强了现成的LLMs,以支持MM输入或输出。

2024-10-10 20:15:00 188

原创 2024:中国AI大模型产业报告揭示的五大技术趋势

云侧模型服务C端(智能问答、生成)和B端(营销、客服等),而端侧大模型因成本低、便携、数据安全,主导C端市场,如手机文档搜索、图像创作等。北京推动技术创新,上海打造国际竞争力大模型,深圳支持开源通用大模型,安徽吸引企业入驻,成都重点研发行业大模型,杭州支持头部企业关键技术攻关。当前,我国 AI 大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI 大模型落地商用,各类通用、行业以及端侧大模型已在多个领域取得了显著的成果,如在金融、医疗、政务等领域,AI 大模型已成为提升服务质量和效率的重要手段。

2024-10-10 19:45:00 186

原创 火爆的大模型背后,有哪些的核心技术!

火爆的大模型背后,有哪些的核心技术!一、TransformerTransformer 是大模型的底层模型。在深度学习的早期阶段,循环神经网络(RNN)是处理序列数据的常用方法。尽管RNN及其变体在某些任务上表现良好,但它们在处理长序列时容易遇到梯度消失和模型退化问题。为了解决这些问题,Transformer模型被提出。而后2020年 OpenAI首次提出**“规模定律”**,指出模型的性能随着参数量、数据量、训练时长的指数级增加而呈现出线性提升,并且该提升对架构和优化超参数的依赖性非常弱[7]。

2024-10-10 16:28:14 333

原创 AI大模型十字路口,到底是持续突破还是陷入低谷?

大模型加持下,人形机器人拥有了聪慧的“大脑”、敏捷的“小脑”、灵活的“肢体”。此外,朱军还提到,大模型技术加速发展背后最核心的原因,则在于大家对这种路线的认知和准备上,达到了比较好的程度,“在物理条件上,比如像云基础设施、计算资源的准备都比较充分,不像ChatGPT刚出来时,大家更多是不知所措。另一方面,从大模型能力的角度来看,从单一模型,到多模态融合,从多模态理解到多模态生成,从模仿学习再到强化学习,可以看到大模型的能力正在纵向(理解多维物理世界)和横向(思考能力,即智商)双向发展。

2024-10-10 16:23:29 361

原创 188+26个国产大模型!【目前最全】

我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。特点与技术:360安全大模型以AI安全为核心,推出了以AI安全为核心的大模型安全解决方案,为企业构建合规、可信、可靠的大模型服务。Minimax的ABAB大模型:Minimax凭借自研实力,推出了包含多个模态(如文本到视觉、文本到语音、文本到文本)的基础模型架构,并成功推出了自研通用大模型“ABAB”,展现了其在多模态处理方面的潜力。它具备跨模态、跨语言的深度语义理解与生成能力。

2024-10-10 14:55:15 394

原创 在AI大模型的转折点,该怎么抓住机遇?

然而,随着o1模型的推出,OpenAI揭示了在预训练Scaling Law的基础上,通过在后训练阶段引入强化学习(RL)并在推理过程中增加长内部思维链(CoT,意味着更多的计算步骤),同样能够显著提升模型的性能。在科学能力方面,对于博士级的科学问题(GPQA Diamond),GPT-4o的精确度为56.1%,人类专家水平为69.7%,而o1模型则达到了78%,超越了人类专家的能力。综上所述,在新的大模型训练范式下,从定性角度看,模型需要更多的训练和推理算力来支持其性能的提升。

2024-10-10 14:47:15 432

原创 AI大模型终极扫盲系列——初识大模型

作为相关从业人员,可以开发更高效,更稳定的训练算法,不断探索大模型的上限,作为普通人,我们更需要拥抱这个技术,至少在日常工作和生活中也能享受到其带来的巨大便利。**5)公司业务定制化大模型:**大模型具有通用性能力,但是在很多零样本的场景的表现依然比不上那个领域正在使用的产品,例如在某些垂直领域,包括工业领域,医药领域,管理领域等场景下进行专业问题,研究型问题的使用依然需要特定场景的数据进行微调,这种定制化的服务也能给企业带来巨大的效率提升和节省成本的收益,属于比较有前景的业务。

2024-10-10 14:37:38 752

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除