支付宝开放平台-开发者社区——AI 大事记「第五期」

Part1 AI first——前沿资讯

  • 你朋友的朋友圈里的女朋友/男朋友可能是假的!!

       你告诉我什么是真的?!(请手动脑补关晓彤表情包)                   最近Flux的爆火,简直把所有人的三观都撼动了。

        AI生图工具Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI的进化越来越完美了!

        作者表示,自己的目的并不只是创建网红,而是制作自动化广告、YouTube、TikTok视频、教学视频、营销、讲解课程等等。

        甚至当AI达到足够快时,它就能达到实时生成,FaceTime AI朋友或者AI治疗师都有望成真。

Part2 AI技术早知道

  • OpenAI「草莓」提前曝光?ChatGPT版搜索引擎惊现神秘模型

OpenAl的「草莓」项目备受关注,尽管具体细节尚未公开,但其竞争对手 Perplexity Al 已展示具备类似「草莓」能力的新模型。

perplexity Al 的CEO Aravind Srinivas 通过在线演示展示了其 Al 的逐步思考能力,如成功解答「草莓覆盖火星」的问题。

Perplexity Al的月度收入和使用量自年初以来增长了7倍,目前已完成 2.5 亿美元的新一轮融资,其商业模式正从订阅转向广告,与谷歌等展开竞争。

尽管Al 生成错误信息的风险存在,但Perplexity Al 正努力提高 Al 的可靠性,以适应主流使用。

来自:新智元|阅读原文

Part3 AI实时应用

  • 开源模型:Stability AI 推出Stable Fast 3D 开源模型

特点:

  1. 可以在0.5秒内降一张图片变成一个完美的3D模型
  2. 生成质量不错,纹理细致。还能生成额外的材质参数和法线贴图
  3. 适用于游戏、虚拟现实、零售、建筑和设计等各种领域。
  4. 生成的3D模型可以在支持WebXR的设备上进行增强现实展示和互动。可以快速创建游戏中的静态物体、电子商务中的3D产品展示、AR/VR中的模型等。

项目地址:SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement

在线体验:https://huggingface.co/spaces/stabilityai/stable-fast-3d

Part4 AI课堂小科普

科普小课堂:

问:当前多模态能力比较强的模型有哪些?

答:

  1. 智谱·AI 的 CogAgent-18B:基于 CogVLM-17B 改进的开源视觉语言模型,拥有 110 亿视觉参数和 70 亿语言参数,支持 1120*1120 分辨率的图像理解,具备 GUI 图像的 Agent 能力。
  2. X-LLM:扩展到包括音频在内的各种模式,并表现出强大的可扩展性。
  3. VideoChat:开创了一种高效的以聊天为中心的 MM-LLM 用于视频理解对话。
  4. InstructBLIP:基于预训练的 BLIP-2 模型进行训练,在 MM IT 期间仅更新 Q-Former。
  5. PandaGPT:能够理解 6 种不同模式的指令并根据指令采取行动。
  6. PaLI-X:使用混合 VL 目标和单峰目标进行训练。
  7. Video-LLaMA:引入了多分支跨模式 PT 框架,使 LLM 能够在与人类对话的同时同时处理给定视频的视觉和音频内容。
  8. 视频聊天 GPT:专门为视频对话设计的模型,能够通过集成时空视觉表示来生成有关视频的讨论。
  9. Shikra:专为参考对话而定制的简单且统一的预训练 MM-LLM,展示了值得称赞的泛化能力。
  10. DLP:提出 P-Former 来预测理想提示,并在单模态句子数据集上进行训练。
  11. BuboGPT:通过学习共享语义空间构建的模型,用于全面理解 MM 内容。
  12. ChatSpot:引入了一种简单而有效的方法来微调 MM-LLM 的精确引用指令。
  13. Qwen-VL:一个多语言 MM-LLM,支持英文和中文,还允许在训练阶段输入多个图像。

Part5 AI-问题库:(话题互动)

话题讨论:

  • 关于Flux的爆火,你怎么看?

开发者话题讨论:

  • 问:会不会未来家家一个贾维斯?——来自超级可达鸭

获奖规则:

  1. 提问/回答:前提-符合逻辑,有出处,有来源,言之有物
  2. 提问/回答:
    1. 点赞数/评论数之和超过20且符合前提可获得一等奖
    2. 点赞数/评论数之和超过10且符合前提可获得二等奖
  3. 提问/回答:参与者符合前提条件下即可获得三等奖

奖品名

奖品数量

奖品图片

蚂蚁周边大容量托特包

(一等奖)

1

蚂蚁周边真丝眼罩

(二等奖)

2

开发者积分(三等奖)

10

1500积分

Ps:最终解释权归开发者社区所有

Part6 AI内容库

  1. AI相关文章发布——发文规则同【江海计划】

Part7 下期预告

  • 乱拳打死老师傅——AI「哄哄模拟器」!

对此,你怎么看?

详情查看参与互动赢蚂蚁周边


支付宝开放平台-开发者社区

 「AGI 之路」 内容库

欢迎你的投稿!戳我进群


支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值