🤖Musashi:东京大学开发并训练了一款可以自己开车的机器人
- 这款名为Musashi的“肌骨类人机器人”,能够驾驶一辆小型电动车。
- 它可以“看见”前方道路及车侧后视镜的景象。
- 还能使用机械手旋转车钥匙、拉手刹和打开转向灯,并用“脚”踩油门和刹车。
- 基于学习的识别模块,它还可以识别交通信号灯、行人和其他车辆,并做出相应的驾驶决策。
🔗论文: https://arxiv.org/pdf/2406.05573
🔗信息来源: https://x.com/KKawaharazuka/status/1800453023493484846
🔗 https://blink.csdn.net/details/1728066
🚀Uizard 发布 Autodesigner 2.0 AI设计引擎
- 只需文字或截图几秒钟内完成网站设计
- 可使用文字提示生成和修改 UI 设计的任何部分
- 可精确生成 UI,支持多种操作如翻译和颜色调整。
- 用户可以上传应用、网站或 UI 的截图、原型,Uizard 会利用 AI 技术将这些截图转换为可编辑的应用设计。
🔗 https://blink.csdn.net/details/1728095
🎥美图公司今天发布的AI视频制作工具:moki
将视频生成模型和工作流直接内置,可以一键生成AI视频短片。
专注于网文短剧、故事绘本、动画短片和MV这四种视频形式。
可以直接通过文本驱动脚本、角色、视频以及音效配音等一起完成。中途可以控制生成的各个阶段。
🔗 https://blink.csdn.net/details/1728106
🍏苹果没有向 OpenAI 支付任何费用来使用ChatGPT
苹果公司与OpenAI达成了一项具有里程碑意义的协议,将ChatGPT集成到iPhone、iPad和Mac设备中。
但是苹果不会向OpenAI支付任何现金,苹果认为将 OpenAI 的品牌和技术推广到数亿台设备中的价值等同或更高于金钱支付。
🗣️Luma 发布 DIT 视频生成模型 Dream Machine
- 具有物理交互理解
- 能根据文本生成5秒钟的镜头,具备逼真的平滑运动、电影摄影和戏剧性效果。
- 具有了解人、动物和物体如何与物理世界互动的能力,确保生成的视频角色和场景具有一致性和物理准确性。
- Luma Dream Machine能够在120秒的时间内生成一个包含120帧(frames)的高质量视频。
- Dream Machine帮助用户实验各种流畅、电影化和自然的摄像机运动,确保摄像机运动能够匹配场景的情感和内容。
- 用户可以模拟各种摄像机移动效果...
🔗体验地址:https://lumalabs.ai/dream-machine
🔗 https://blink.csdn.net/details/1728097
🌐Stability AI 开源其 Stable Diffusion 3 Medium 模型
- 可在消费级笔记本电脑上运行
- 该模型包含 20 亿个参数。在图像质量上有显著提升,能够生成更高质量、更细腻的图像。能够更准确地将文本描述转换为图像。
- Stable Diffusion 3 Medium 模型的尺寸较小,这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。
- 这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。
🔗官方介绍: https://stability.ai/news/stable-diffusion-3-medium
🔗模型下载: https://huggingface.co/stabilityai/stable-diffusion-3-medium
🔗技术报告:https://stability.ai/news/stable-diffusion-3-research-paper
🔗GitHub资源:
https://github.com/comfyanonymous/ComfyUI
https://github.com/Stability-AI/StableSwarmUI