首个AI码农来了

最新推荐文章于 2024-09-30 21:48:12 发布

啥都生

最新推荐文章于 2024-09-30 21:48:12 发布

阅读量779

点赞数 11

分类专栏： AI资讯文章标签：人工智能

本文链接：https://blog.csdn.net/zzh516451964zzh/article/details/136770380

版权

AI资讯专栏收录该内容

30 篇文章 2 订阅

订阅专栏

B站：啥都会一点的研究生
公众号：啥都会一点的研究生

Devin：首位AI软件工程师

美国初创公司 Cognition AI 推出了世界上第一个人工智能软件工程师 Devin，这是一项开创性的发展。Devin可以自主使用自己的 shell、代码编辑器和网络浏览器解决工程任务，能自主执行规划、编码、调试和部署项目等任务

SWE-Bench 基准测试要求AI解决 GitHub 在实际开源项目中发现的问题，在该测试中，Devin 在无人协助的情况下正确解决了 13.86% 的问题，远远超过了之前SOTA模型 1.96% 的无人协助和 4.80% 的协助性能。Devin还成功通过了大型AI公司的实际工程面试，甚至完成了真实的工作

https://twitter.com/cognition_labs/status/1767548763134964000

由 OpenAI 驱动的 "Figure 01 "机器人可以聊天、感知和完成任务

Figure 与 OpenAI 合作开发了一款名为 "Figure 01 "的开创性机器人，它可以根据口头请求执行任务并进行完整的对话，即使是那些模棱两可或依赖于上下文的请求。通过将机器人连接到由 OpenAI 训练的多模态AI模型上实现

在这里插入图片描述

AI模型处理机器人的整个对话历史，包括图像，使其能够生成适当的语言回应，并选择最合适的学习行为来执行给定的命令。机器人的行动由视觉运动转换器控制，该转换器可将视觉输入转化为精确的物理动作

https://venturebeat.com/ai/openai-powers-a-robot-that-can-hand-people-food-pick-up-trash-put-away-dishes-and-more/

华为推出文生图模型 PixArt-Σ

华为诺亚方舟实验室（Noah’s Ark Lab）推出了 PixArt-Σ，这是一种文生图模型，可根据提示创建 4K 分辨率图像，准确性令人惊讶。与 SDXL 等模型相比，PixArt-Σ 的参数要少得多，但在图像质量和提示匹配方面却胜过它们

在这里插入图片描述
该模型采用 "从弱到强 "的训练策略和高效的标记压缩以降低计算要求。依赖于高分辨率图像和描述准确的训练数据。研究人员称，PixArt-Σ 可以赶上 Adobe Firefly 2、Google Imagen 2、OpenAI DALL-E 3 和 Midjourney v6 等商业替代产品

https://pixart-alpha.github.io/PixArt-sigma-project/

Apple收购加拿大人工智能初创公司 DarwinAI

DarwinAI 开发了用于在制造过程中对部件进行视觉检测的人工智能技术，为各行各业的客户提供服务。但它的核心技术之一是让人工智能系统变得更小、更快。这会对苹果公司有所帮助，因为苹果公司正专注于在设备上而不是完全在云端运行AI

在苹果公司今年大力推进人工智能之前，这项不引人注意的收购已经到来。首席执行官蒂姆-库克（Tim Cook）承诺，苹果今年将在人工智能领域 “开辟新天地”，预计最快将在 6 月份的全球开发者大会上宣布这一消息

https://www.bloomberg.com/news/articles/2024-03-14/apple-aapl-buys-canadian-ai-startup-darwinai-as-part-of-race-to-add-features

Cerebras WSE-3：可支持比 GPT-4 大 10 倍模型的AI芯片

Cerebras Systems 发布了其最新的晶圆级人工智能芯片 WSE-3。拥有惊人的 4 万亿个晶体管，是市场上功能最强大的AI芯片之一。这款第三代晶圆级人工智能超大型芯片的性能是上一代的两倍，同时还非常省电。得益于最新的制造技术，该芯片的晶体管密度提高了 50% 以上

WSE-3 最显著的特点之一是能够支持比 GPT-4 和 Gemini 模型大 10 倍的人工智能模型

在这里插入图片描述

https://the-decoder.com/cerebras-wse-3-enables-ai-models-to-be-ten-times-larger-than-gpt-4-and-gemini/#summary

DeepMind SIMA：无所不能的AI游戏代理

DeepMind推出了SIMA（Scalable Instructable Multiworld Agent），这是一款通用的AI代理，可以理解并遵循自然语言指令，在不同的视频游戏环境中完成任务。SIMA是八个游戏工作室在九款不同游戏中进行训练，标志着游戏AI领域的重要里程碑，因为它展示了将学到的技能泛化到新的游戏世界的能力，而不需要访问游戏代码或API

在这里插入图片描述