每日一看大模型新闻(2024.1.10)推出AIGC提示工具,几个字提示玩转SDXL;Mixtral8x7B论文终于来了:架构细节、参数量首次曝光的AI「意图识别」操作系统!;效果超越Gen-2!字节

1.产品发布

1.1 Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光

发布日期:2024.1.10

Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光

主要内容:Mixtral 8x7B MoE模型是由Mistral AI团队发布的开源模型,它基于Transformer架构,具有开放权重的稀疏专家混合模型(Sparse MoE)。该模型在大多数基准测试中都优于Llama 2 70B和GPT-3.5。Mixtral可以在小批量大小下实现更快的推理速度,并在大批量大小下实现更高的吞吐量。Mixtral预训练上下文的大小为32k,其性能达到或超过Llama 2 70B和GPT-3.5。尤其是在数学、代码生成和需要多语言理解的任务方面,Mixtral表现出卓越的能力,并在这些领域显著优于Llama 2 70B。此外,Mixtral还推出了Mixtral 8x7B – Instruct聊天模型,其性能在人类评估基准上明显超过了GPT-3.5 Turbo、Claude-2.1、Gemini Pro和Llama 2 70B聊天模型。

论文地址https://arxiv.org/pdf/2401.04088.pdf

项目地址GitHub - mistralai/mistral-src: Reference implementation of Mistral AI 7B v0.1 model.

论文主页Mixtral of experts | Mistral AI | Frontier AI in your hands

1.2 7亿人可用的钉钉AI助理来了,微软也加入合作

发布日期:2024.1.10

7亿人可用的AI助理来了,微软也加入合作

主要内容:钉钉最近推出了一项新功能,名为“超级助理”,旨在成为个人和企业都可以个性化定制的AI智能助理平台。该功能建立在感知系统、行动系统和思考系统之上,具备感知、记忆、规划和行动能力,并可以跨应用程序执行任务。超级助理分为个人助理和企业助理两种类型个人助理包括解决家长批改作业问题、AI写真和一键消除未读红点等功能。企业助理则可以让企业将内部知识和业务数据授权给AI,以对话形式进行数据分析等操作。钉钉总裁叶军表示,未来三年内,预计将有1000万个AI助理在钉钉上产生。此外,钉钉还宣布了许多升级,包括推出涂鸦作画、法律助手等多款AI工具,以及与微软合作推出钉钉 Office 套件。

1.3比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁

发布日期:2024.1.10

比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁

主要内容:近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。这一成果被可重构计算领域顶级会议 FPGA’24 接收。FlightLLM 采用了软硬件协同设计来克服低计算效率的挑战,并在 Xilinx Alveo U280 FPGA(16nm)上实现了 FlightLLM。实验结果表明,FlightLLM 的端到端延迟优于 NVIDIA V100S GPU,在能效上超过了 NVIDIA V100S 和 A100 GPU,分别提高了 6.0× 和 4.2×,在性价比上提高了 1.8× 和 1.5×

1.4智源:1bit自然语言理解预训练模型BiPFT

发布日期:2024.1.10

量化新范式:智源提出首个1bit自然语言理解预训练模型BiPFT

主要内容:智源团队提出了首个用于自然语言理解任务的1bit轻量化预训练模型BiPFT。与标准的FP32相比,使用1bit weight和1bit activation,在推理阶段节省了56倍的操作数量和28倍的内存。该工作已被AAAI 2024收录。

1.5首个AI「意图识别」操作系统!真·端侧大模型掀起第四次革命,自研魔法OS来了

发布日期:2024.1.10

首个AI「意图识别」操作系统!真·端侧大模型掀起第四次革命,自研魔法OS来了

主要内容:本文介绍了人机交互的变革,特别是荣耀在2023开发者大会上发布的行业首个基于AI意图识别的人机交互(IUI)操作系统——MagicOS 8.0(魔法OS 8.0),以及首个平台级自研7B端侧AI大模型“魔法大模型”。文章指出,AI正在成为操作系统的“魔法棒”,让人们可以跨设备、跨系统、跨生态地寻找未来智慧新世界的答案。人机交互范式正在迎来第四次革新,而新交互、新内核、新生态是未来OS发力的正确方向。

1.6贾扬清创业新动作:推出AIGC提示工具,几个字提示玩转SDXL,细节拉满

发布日期:2024.1.10

贾扬清创业新动作:推出AIGC提示工具,几个字提示玩转SDXL,细节拉满

主要内容:贾扬清团队的LeptonAI推出了一款名为PromptLLM的AIGC提示工具,只需简单的几个字提示,就能生成具有细节感的绘图。例如输入“鹦鹉吃胡萝卜”,AI会生成一张细节丰富的图片。该工具不仅具备常识,还能根据提示词扩充拍摄视角、头发细节、天气、摄影风格等细节。目前API已开放,可以免费体验Demo。此次工具的发布是贾扬清LeptonAI同HippoML合作的结果,HippoML提供PrivateCanvas系统来保障运行。

体验网址PromptCraft | Write something short, let AI complete it

2.技术更新

2.1挥舞起代码语料的魔杖,大模型和智能体将召唤出更强大的能量

发布日期:2024.1.10

挥舞起代码语料的魔杖,大模型和智能体将召唤出更强大的能量

主要内容:伊利诺伊大学厄巴纳 - 香槟分校的研究团队发布了一项重要综述,探讨了大型语言模型(LLMs)如何通过代码训练获得强大能力。研究人员发现,代码训练可以提高LLMs的编程技能、推理能力和结构化信息处理能力,使其能够应用于更复杂的自然语言任务。此外,代码还可以引导LLMs产生结构化的、精确的中间步骤,并通过函数调用与外部执行端连接。研究人员还观察到,将LLMs嵌入代码执行环境可以实现自动化反馈和模型自主改进。总的来说,代码训练为LLMs作为智能助理在下游应用中的表现提供了有力支持。

2.2 AI构建框架LangChain:推出首个稳定版本

发布日期:2024.1.10

LangChain v0.1.0

主要内容:LangChain宣布推出了第一个稳定版本LangChain v0.1.0,这是大模型AI应用构建框架。该版本完全向后兼容,并提供了Python和JavaScript版,通过功能和文档的改进提高了聚焦度。具体来说,这个版本进行了两个重大的架构更改:将langchain-core分离出来,并将合作伙伴包与langchain分开,放入langchain-community或作为独立的合作伙伴包提供。

技术文档

GitHub - hwchase17/langchain-0.1-guides

GitHub - bracesproul/langchainjs-0.1-guides: Notebooks showing off LangChain.js v0.1.0 features.

2.3效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜

发布日期:2024.1.10

效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜_腾讯新闻

主要内容:字节跳动团队在arXiv上发布了一篇论文,介绍了他们推出的视频生成方法MagicVideo-V2。这种方法将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块整合到一个端到端的视频生成流程中。通过这些架构设计,MagicVideo-V2能够生成高保真度和流畅度的高分辨率视频,并据称在大规模用户评估中表现超过了Gen-2等其他领先的文生视频系统。

参考链接

https://twitter.com/arankomatsuzaki/status/1744918551415443768?s=20

项目链接MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation

论文链接

https://arxiv.org/abs/2401.04468

https://arxiv.org/abs/2211.11018

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值