ChatGPT 去年至今 0 增长;Sora 风暴仍未停歇,大量 AIGC 视频应用涌现 | AI 头条

24b94626a6b7288a9b83cd7770f0bb04.gif

整理 | 王启隆

出品 | AI 科技大本营(ID:rgznai100)

b4feb9daaf5d1364f68e5421dd8f6b21.png

一分钟速览新闻点!

  • ChatGPT 用户一年 0 增长,AI 创业公司涌现

  • UT 奥斯汀推出 StreamingT2V 视频生成技术

  • DeepDataSpace 发布 T-Rex2,无需训练即可精准识别视频中的各种对象

  • DALL-E 3 即将支持图像编辑功能,生成完图片还能改细节

  • AI 电影工具 LTX Studio 定期 3 月 27 日发布

  • 初创公司 Suno 发布 AI 作曲编曲工具 Suno V3

  • 初创公司 Eliyan 获 6000 万美元融资加速 AI 芯片互连技术

  • AI 数据整理公司 Foundational 完成 800 万美元种子轮融资

  • 胡润全球富豪榜:马斯克重回榜首,AI 贡献过半财富

8fda75783288ff0f973712aa3cf5a603.png

全球 AI 要闻

ChatGPT 用户一年 0 增长,AI 创业公司涌现

从 2023 年 3 月到现在,ChatGPT 用户增长停滞,而开源大语言模型(LLM)如 LLaMA 的发布引领了 AI 领域的新浪潮。与此同时,专注于特定用例的 AI 创业公司在这一年间崛起,它们能够提供更好的用户界面、集成和隐私保护。OpenAI 通过其 API 在捆绑和非捆绑 AI 能力方面均取得成功,但同时也面临着来自开源模型的竞争。如今新的 AI 模型和工具不断涌现,AI 行业的融资活动也在持续增长,显示出该领域的活跃和潜力。(Latent Space)

Sora 开始催生 AIGC 文生视频应用

得克萨斯大学奥斯汀分校(UT 奥斯汀)团队在 3 月 21 日发布论文,其研发的 StreamingT2V 技术引领 AI 视频生成领域创新,成功实现基于文本生成长达 2 分钟、高达 1200 帧的高质量连续视频。该技术借助条件注意力模块(CAM)与外观保持模块(APM)双核结构,保障视频连续性和视觉一致性。实施流程分三步:初始化构建前 16 帧,Streaming T2V 阶段采用自回归技术延续视频内容,最后通过 Streaming Refinement 优化画面质量和动作流畅度。

论文:https://arxiv.org/abs/2403.14773

GitHub:https://github.com/Picsart-AI-Research/StreamingT2V

DeepDataSpace 推出 T-Rex2:革新目标检测技术

3 月 22 日,DeepDataSpace 发布了 T-Rex2,能在无需训练的情况下精准识别一段视频中从日常到生僻的各种对象。T-Rex2 利用文本提示的开放词汇检测和视觉提示的直观表示,克服了传统方法的局限性。该模型在四个学术基准测试(COCO、LVIS、ODinW 和 Roboflow100)上实现了最先进的性能,并且适用于多种实际应用场景,如农业、工业、生物医学、零售等。DeepDataSpace 现开放 T-Rex2 的免费API访问,以支持教育和研究工作,并邀请跨领域的创新和合作。

GitHub:https://github.com/IDEA-Research/T-Rex

DALL-E 3 即将支持图像编辑功能,生成完图片还能改细节

人工智能图像生成工具 DALL-E 即将迎来重大更新,新增局部重绘编辑功能。这一突破性改进将赋予用户前所未有的灵活性,使他们能够在现有图像上直接进行精准局部修改与创新设计。用户只需选择并涂抹目标区域,即可启动 DALL-E 的智能重绘引擎,实现对图像内容的修正、增添或风格变换。此功能不仅扩展了工具实用性,更降低了图像创作门槛,让非专业人士也能借助 AI 技术轻松实现高质量图像编辑与合成。

AI 电影工具 LTX Studio 定期 3 月 27 日发布

除了一系列模仿者,AIGC 界还出现了直接踢馆 Sora 的“电影生成工具” LTX Studio,该平台声称能让用户掌控视频创作过程中从创意构思到实际制作的每一个环节,确保最终作品精准实现个人艺术构想。用户能够体验到叙事方式的革新,得益于专门的人工智能技术,可以精细指导每个场景直至特定的摄影机角度;还能自动生成角色并确保跨帧时身份与风格的一致性;只需一键操作,即可完成带有特效(SFX)、音乐配乐以及配音的视频项目最终剪辑工作。目前,LTX Studio 预告在 3 月 27 日正式发布。

初创公司 Suno 发布 AI 作曲编曲工具 Suno V3

AI 初创企业 Suno 最近上线了一款革命性的音乐创作工具——Suno V3。该平台免费开放,其中包括不少华语音乐人。该工具仅需数秒即可谱写出长达两分钟的高品质原创歌曲,并支持多样化的音乐风格和流派定制,包括为指定歌词生成专属旋律。更令人惊艳的是,Suno V3 还能模拟不同歌手的声音特点进行演绎。该公司透露,目前正全力研发下一代产品 V4,致力于引入更多颠覆性功能。

Eliyan 获 6000 万美元融资加速 AI 芯片互连技术

美国的初创公司 Eliyan 宣布获得 6000 万美元的融资,用于发展其芯片互连技术,该技术旨在加速 AI 芯片的性能。这轮融资由三星催化剂基金(Samsung Catalyst Fund)和老虎环球管理公司(Tiger Global Management)共同领投,投资者还包括知名的英特尔资本(Intel Capital)。此前,该公司曾推出高性能符合 UCIe 标准的 5 纳米小芯片互连技术。随着 AI 和机器学习应用对计算力的需求不断增长,Eliyan 的技术有望为 AI 芯片带来更高效的数据传输和更低的延迟,从而推动 AI 硬件的进步。这轮融资将支持 Eliyan 继续其研发工作,并可能加速其创新解决方案的市场推广。

Foundational 完成 800 万美元种子轮融资,专注数据质量和 AI 准备度挑战

Foundational,一家专注于整理现代数据基础设施的初创公司,宣布已在种子轮融资中筹集到 800 万美元。该轮融资由 Viola Ventures 和谷歌的 AI 投资基金 Gradient Ventures 领投,并获得天使投资者和其他风险投资公司的参与。

Foundational 的平台能够自动映射和分析数据团队的代码,识别潜在问题,提出修复建议,并帮助准备用于 AI 应用的数据。该项目旨在通过自动分析数据团队的源代码来解决组织在扩大数据能力时面临的挑战,映射数据血统并识别潜在问题。该平台与 GitHub 集成,直接在开发者现有的工作流程中提供可操作的建议和修复。

GitHub:https://github.com/apps/foundational-io

胡润全球富豪榜:马斯克重回榜首,AI 贡献过半财富

胡润研究院最新发布的《2024 胡润全球富豪榜》显示,十亿美元企业家人数同比增长 5%,财富总量上升 9%,其中过半新增财富源自 AI 行业。全球共 3279 位十亿美元企业家上榜,集中于金融、消费品、食品饮料和房地产等行业。52 岁马斯克以特斯拉和 SpaceX 的成功跃居首富,中美两国占据了近半数十亿富豪。AI 领域的快速发展带动了众多企业家财富增长,包括英伟达 CEO 黄仁勋等。中国稳居全球十亿美元企业家数量首位,北京成 AI 创业高地。

41e902632bbaeb3fd006fd4888b6bf55.gif

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。

b763d6be73f53e590faf22f837613b96.png

  • 11
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值