自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(115)
  • 收藏
  • 关注

原创 知名UP主何同学被指盗用开源项目 本人致歉称文案不够严谨

知名UP主何同学被指盗用开源项目!本人致歉称文案不够严谨视频原话为:“所以我们专门写了一个软件,可以把预览动画里面的色块转换成字符,提高效率,但为了最自然的效果,前面白条,躲避障碍的动画,依然是一行一行画的。最后这个文档有36万。

2024-11-20 08:07:25 267

原创 ​Mistral推最强开源多模态模型 Pixtral Large,升级Le Chat可直接调用Flux Pro

法国人工智能初创公司 Mistral AI 宣布为其 Le Chat AI 助手添加了一系列新功能,包括集成的网络搜索、图像生成以及新推出的 Pixtral Large 模型。

2024-11-19 15:53:55 672

原创 Grok 3 证明黎曼猜想?AI训练出大事吓坏网友 最后发现是乌龙

AI在数学领域的潜力:尽管Grok-3证明黎曼猜想的消息被证实为不实,但这起事件引发了人们对AI在数学证明中潜力的讨论。Grok-3的训练背景:Grok-3是由AI初创公司xAI开发的第三代大型语言模型,其训练依托的是目前世界上最大的AI训练集群Colossus,由10万个液冷英伟达H100 GPU组成。社交媒体上的声明:xAI工程师Hieu Pham在社交媒体上发布了一条消息,声称Grok-3成功证明了黎曼猜想,并因此暂停了模型的训练,但随后他澄清这只是一场调侃。

2024-11-19 15:47:50 469

原创 太疯狂了,Mistral AI开源最大的VLLM多模态大模型——Pixtral-Large-Instruct-2411

Mistral-Large-Instruct-2411 是一种高级密集型大型语言模型 (LLM),具有 123B 参数,设计用于语言理解和生成的各个方面。它是 Mistral-Large-Instruct-2407 的扩展,在长上下文、函数调用和系统提示处理方面提供了更好的功能。Mistral-Large-Instruct-2411 的突出特点之一是它的多语言支持,可支持数十种语言,包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语。

2024-11-19 12:05:22 1147

原创 Linux 6.13 将工作队列并发限制提高了四倍

在将违规使用切换到专用工作队列的同时,利用这个机会将 WQ_MAX_ACTIVE 提升四倍,并记录系统工作队列不应饱和。工作队列至少应为系统工作队列饱和的情况添加警告机制。“最近的工作队列更新支持更灵活的执行拓扑结构使得非绑定工作队列使用按 CPU 工作者池前端,这推高了工作队列刷新开销。在过去的许多年中,每个 CPU 的工作队列执行上下文数量上限一直是 512,但随着 Linux 6.13 的发布,这一上限将翻两番,达到 2048。Linux6.13的另一个工作队列变化也值得注意。

2024-11-19 10:53:50 382

原创 M4 Max在Blender GPU基准测试中落后RTX 4090近30% 但超越RTX 4070和3080 Ti

考虑到 M4 Max GPU 在 Apple Silicon 产品线中的中高地位,它的得分相当可观,根据 Blender 提供的数据,M4 Max 芯片让竞争对手感到胆寒,今天的 Blender Open Data 可以允许用户测试芯片的 CPU 和 GPU 性能。从 Blender 的结果可以看出,台式机版的 RTX 4090 以 10880 的分数位居榜首,虽然 M4 Max 芯片的性能远不及它,但未来苹果 M4 Ultra 芯片可能会一举实现反超。

2024-11-19 10:49:43 2418

原创 【AI绘画】Alpha-VLLM 的 Lumina-Next:新一代图像生成器

Lumina-Next-T2I 是在 Lumina-T2I 成功基础上发展起来的尖端图像生成模型。它采用了带有 2B 参数模型的 Next-DiT 和 Gemma-2B 文本编码器,推理速度更快,生成样式更丰富,并增强了多语言支持。

2024-11-18 11:20:04 1259

原创 爱诗科技PixVerse文生视频、图生视频技术服务全球开放

故事续写功能则允许用户在已生成视频的基础上添加提示词,实现情节递进,同时保持人物和动作的高度连贯性。模型通过一系列生动的示例展示了其生成视频的能力,如武士在雪天奔跑的场景、戴着巫师帽的猫以及大熊猫在秋千上休息的画面,这些示例充分展示了PixVerse V3 在视频生成方面的高级能力。在此之前,爱诗科技PixVerse V3 已全球同步公开上线,PixVerse V3 在底层模型能力上实现了显著提升,提供了包括创意模板、口型匹配、故事续写和风格转换在内的多模态生成能力和丰富的AI玩法。

2024-11-18 10:33:27 809

原创 NVIDIA Blackwell B200新照:八卡并行 总功耗8000W

NVIDIA Blackwell架构的新一代服务器正在批量出货,而在OCP Summit 2024峰会上,官方进行了公开展示,而且是直接将芯片裸露在外,随便看。相比前代服务器,NVIDIA做了一些调整,主要是NVLink互联控制芯片,不再位于服务器边缘,而是转移到了中心,被八颗B200所包围。另外还可以看到Astera Labs提供的多颗PCIe Retimer芯片。八颗加起来,那就是恐怖的8000W——一个小时8度电。这样的好处是可以缩短与GPU之间的距离。

2024-11-18 07:35:35 178

原创 垃圾堆里捡到宝:还能正常工作的撕裂者3960X、RTX 2080 Ti

Redditor网友Seizo是一名负责运送垃圾的卡车司机,对电脑也有所了解,最近发了一笔“意外之财”,在一堆垃圾中赫然捡到了一台还能正常工作的电脑,配置还不低!处理器是AMD的线程撕裂者3960X,Zen2架构,24核心48线程,2019年发布的,当时售价达10699元(1399美元)。你可能觉得它们落后了,但要知道,撕裂者3960X的性能基本是i9-13900K的级别的刚刚发布的PS5 Pro都还在用Zen2架构,RTX 2080 Ti也大致和RTX 4060 Ti差不多。

2024-11-18 07:23:44 171

原创 LLM2CLIP:通过大型语言模型扩展 CLIP 的能力边界

微软的 LLM2CLIP 利用大型语言模型(LLM)来增强多模态模型 CLIP(对比语言图像预训练)的功能。LLM2CLIP 解决了现有 CLIP 模型的局限性,例如上下文窗口受限和文本理解能力较弱,它整合了 LLM 的强大功能,从而增强了对更长、更密集和更复杂字幕的理解能力。这种整合可以提供更丰富的文本上下文,改进文本与图像的对齐,并提供开放世界的知识,从而提高多模态特征对齐和训练效率。

2024-11-17 10:58:40 1921

原创 月之暗面发布k0-math推理模型 对标OpenAI o1系列

月之暗面Kimi Chat面向全社会开放服务一周年之际,月之暗面宣布推出新一代数学推理模型k0-math。基准测试显示,Kimi k0-math的数学能力可对标全球领先的OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-

2024-11-17 09:54:33 518

原创 探索 Shuttle 3 Diffusion的力量: 从文本到图像的人工智能模型

在人工智能领域,从文字描述生成高质量图像的能力是一项了不起的壮举。Shuttle 3 Diffusion 是一种尖端的文本到图像人工智能模型,它将这种能力提升到了新的高度。凭借其先进的功能和高效的设计,Shuttle 3 Diffusion 将彻底改变我们创建视觉内容并与之互动的方式。Shuttle 3 Diffusion 是一种创新的人工智能模型,只需四个步骤就能将文字提示转化为令人惊叹的图像。它在图像质量、排版和理解复杂提示方面表现出色,同时还能保持资源效率。

2024-11-16 10:21:18 1407

原创 DimensionX: 革新三维和四维场景生成技术

欢迎来到 DimensionX 的世界,这是一个开创性的框架,它正在改变我们创建和可视化数字环境的方式。在本博客中,我们将探讨 DimensionX 如何突破计算机视觉和模式识别的界限,从单一图像中生成令人惊叹的逼真 3D 和 4D 场景。

2024-11-16 09:45:50 784 2

原创 Intel强行删除酷睿Ultra 200S DLVR超频模式

DLVR允许每个P核核心、每个E核集群拥有独立可调的电压,尤其是在没有满载的情况下,可以大大降低功耗,这也是Intel一直宣传游戏功耗大幅降低的前提条件之一。,严重影响酷睿Ultra 200S极限超频,导致大量玩家感到不满和失望。Intel对此解释说,为了防止一般玩家错误地使用DLVR模式,因此限制它只能在液氮超低温的极限超频场景下使用。,但并未启用,一直到最新的Arrow Lake酷睿Ultra 200S系列上才开放。因此,超频玩家一般会关闭此功能,防止出现瓶颈和供电损失。

2024-11-16 09:05:05 340

原创 Xbox 推出 AI 搜索功能,输入简单关键词就能找到游戏

通过 AI 的智能算法,玩家只需输入一些简单的关键词,系统就能迅速为其提供相关游戏的推荐,省去了以往逐一搜索的麻烦。AI 增强搜索正是应对这一挑战的有效方案,让更多的玩家能够更快找到他们喜欢的游戏。例如,玩家可以输入 “带有僵尸的 FPS 游戏” 或者 “可以钓鱼的舒适农场游戏”,而系统会根据这些描述为他们推荐相应的游戏。这种智能搜索不仅可以帮助玩家找到自己心仪的游戏,也能让那些对游戏名称记不清楚的用户轻松找到合适的选择。相信在不久的将来,更多的玩家将会体验到这一功能带来的便利,享受更丰富的游戏世界。

2024-11-16 07:55:20 277

原创 【个人笔记】如何将 Linux 文件系统扩容

虽然很多人都习惯了在Windows上对磁盘扩容,但是Linux主要通过界面来实现扩容。:由于本人吴脑的键客是个散修,不专业之处勿喷,请关注并私聊。

2024-11-15 16:46:19 646

原创 释放高级功能:Nexusflows Athene-V2-Agent在工具使用和代理用例方面超越 GPT-4o

在不断发展的人工智能领域,Nexusflows 推出了 Athene-V2-Agent 作为其模型系列的强大补充。这种专门的代理模型设计用于在功能调用和代理应用中发挥出色作用,突破了人工智能所能达到的极限。

2024-11-15 11:14:30 1726

原创 英伟达基于Mistral 7B开发新一代Embedding模型——NV-Embed-v2

我们介绍的 NV-Embed-v2 是一种通用嵌入模型,它在大规模文本嵌入基准(MTEB 基准)(截至 2024 年 8 月 30 日)的 56 项文本嵌入任务中以 72.31 的高分排名第一。此外,它还在检索子类别中排名第一(在 15 项任务中获得 62.65 分),这对 RAG 技术的发展至关重要。NV-Embed-v2 采用了多项新设计,包括让 LLM 关注潜在向量,以获得更好的池化嵌入输出,并展示了一种两阶段指令调整方法,以提高检索和非检索任务的准确性。

2024-11-15 10:48:00 969

原创 人工智能先驱Francois Chollet离开Google

Google开发者博客上的一篇帖子指出,Keras拥有200多万用户,为从Waymo的自动驾驶汽车到YouTube、Netflix和Spotify上的推荐引擎等众多备受瞩目的科技产品提供支持。乔莱经常争辩说,许多开发人工智能的主要实验室所采取的方法–向模型提供越来越多的数据和计算资源无法实现像人类一样"聪明"的人工智能。相反,他认为,帮助模型以更像人类的方式进行"推理"的方法,如神经符号人工智能,才是最有前途的发展道路。在那段时间里,深度学习从一个小众的学术课题变成了一个拥有数百万员工的庞大产业。

2024-11-15 09:14:47 290

原创 OpenCoder: 顶级代码大型语言模型的开放式食谱

是一个开放的、可重现的代码 LLM 系列,包括 1.5B 和 8B 基本模型和聊天模型,支持中英文两种语言。从零开始,OpenCoder 在由 90% 的原始代码和 10% 的代码相关网络数据组成的 2.5 万亿个标记上进行预训练,并在超过 450 万个高质量 SFT 示例上进行监督微调,最终达到顶级代码 LLM 的性能。我们不仅提供模型权重和推理代码,还提供可重现的训练数据、完整的数据处理管道、严格的实验消融结果和详细的训练协议。

2024-11-15 06:00:00 559

原创 ​DeepSeek AI 发布图像理解与生成的统一 AI 框架JanusFlow,性能超越SDXL

与传统的使用扩散模型作为外部工具的统一系统相比,JanusFlow 提供了更简单、更直接的生成过程,局限性也更少。为了解决这些问题,DeepSeek AI 推出了 JanusFlow,这是一个强大的 AI 框架,旨在统一图像理解与生成。通过消除对独立的 LLM 和生成组件的需求,JanusFlow 实现了更为紧密的功能集成,同时降低了架构复杂性。该架构包括用于理解和生成任务的独立视觉编码器。在人工智能驱动的图像生成与理解领域,尽管取得了快速进展,但仍存在显著挑战,阻碍了一个无缝、统一的方法的发展。

2024-11-14 14:12:33 4401

原创 Pixverse毒液变身走红抖音 催红代制作服务

该平台不仅支持经典的黑色毒液造型,还允许用户通过修改提示词自定义毒液的颜色,甚至可以选择预设的彩色版本,大大提升了创作的趣味性和个性化程度。这一系列功能的推出,展现了AI视频生成技术在娱乐应用领域的巨大潜力,也预示着AI视频创作工具正在进入一个更加注重用户体验和实用性的新阶段。在Pika的捏脸特效掀起第一波AI视频创作热潮后,Pixverse的超英特效系列无疑为这个领域注入了新的活力,让AI视频生成技术走出实验室,真正服务于普通用户的创意表达。

2024-11-14 13:38:19 229

原创 拆解测试显示Mac Mini (2024)固态硬盘并未锁定 互换硬盘后仍可使用

当然那这里又会存在一个新坑:某些二手交易平台上价格相对较低的 Mac Mini (2024) 16GB+2TB 版有可能就是替换的硬盘,如果用户不了解这种情况的话可能就会被割韭菜。不过知名拆解网站 iFixit 的测试显示,同型号的 Mac Mini 互换硬盘是可以继续使用的,这意味着苹果应该没有对硬盘小板进行锁定,所以在互换硬盘后重装系统仍然可以使用。但这仅限于同型号的,例如搭载 M4 芯片的和搭载 M4 Pro 芯片的固态硬盘是不能互换的,互换后将触发某种验证导致无法安装系统。

2024-11-14 13:24:44 1372

原创 TableGPT2-7B:用于表格数据分析的大规模解码器模型

TableGPT2-7B 是浙江大学开发的最先进的大规模解码器模型,专为涉及表格数据的数据密集型任务而设计。该模型以 Qwen2.5 架构为基础,包括针对表格数据的专用编码,其中独特的语义编码器可从行、列和整个表格中获取洞察力。

2024-11-14 09:51:05 2486

原创 MIT Han 实验室开源了一个Flux的量化项目——SVDQuant

麻省理工学院(MIT)Han 实验室一直在积极开展一系列项目,包括微小机器学习(Tiny Machine Learning)、SANA、SVDQuant 和 QServe,这些项目旨在提高人工智能计算的效率,并实现在边缘设备上的高效部署。根据实验室的博文,SVDQuant 是一种用于扩散模型的后训练量化范式,可以实现精确的 4 位量化,并在 16GB 4090 笔记本电脑上支持 12B FLUX 模型,速度提高了 3 倍。这一突破使大型语言模型能够在笔记本电脑等边缘设备上部署,同时保持高性能。

2024-11-14 09:15:01 1302

原创 阿里巴巴 Qwen2.5-Coder: 代码智能的革命

在人工智能领域,Qwen 团队一直致力于创建一个强大的编码模型,以彻底改变我们处理代码智能的方式。本文旨在深入介绍 Qwen2.5-Coder,它是最新的 Qwen 大语言特定代码模型系列。目前,Qwen2.5-Coder 已涵盖 0.5、1.5、3、7、140、320 亿参数六种主流模型大小,可满足不同开发者的需求。

2024-11-13 10:56:53 1383

原创 百度秒哒:开启无代码应用开发新时代

秒哒是一款由百度推出的无代码工具,旨在让每个人都能轻松创建复杂的应用程序,而无需具备专业的编程知识。秒哒的核心理念是“只靠想法就能赚钱”,通过自然语言交互,用户可以快速搭建出功能强大的系统。这一工具的推出,不仅降低了应用开发的门槛,还极大地提高了开发效率,使得更多人能够参与到技术创新中来。无论是创业者、中小企业主,还是普通用户,都可以利用秒哒实现自己的创意,而无需担心技术障碍。秒哒的发布,标志着无代码技术进入了一个新的阶段。

2024-11-13 10:08:25 1566

原创 字节跳动推出 SeedEdit:利用人工智能和文本命令革新图像编辑技术

抖音和头条等流行应用程序背后的技术巨头字节跳动公司(ByteDance)推出了其最新创新产品SeedEdit,这是一种人工智能图像编辑模式,通过基于文本的命令简化了编辑过程。SeedEdit 旨在彻底改变用户编辑图像的方式,让所有人都能轻松、直观地编辑图像。这款革命性的图像编辑工具突破了传统图像编辑的技术壁垒,用户可以通过自然语言命令轻松完成修图、换装、美化、风格转换、添加或删除特定区域元素等复杂操作。例如,生成一张小狗在草地上奔跑的图片后,用户只需输入 “将背景改为海边”,即可实现完美的场景过渡效果。

2024-11-13 09:20:55 1596

原创 任天堂强势打击Switch模拟器 Ryujinx官网已被掌控

任天堂之所以持续强力打击Switch模拟器,主要原因在于模拟器侵犯了其知识产权,并可能导致盗版游戏泛滥,损害其游戏销售和品牌形象。通过法律手段和直接接触模拟器开发者,任天堂是在维护其商业利益,并保护其游戏软件的完整性。10月1日,Ryujinx模拟器开发者gdkchan在其官方Discord频道发布声明,称任天堂与其达成协议,要求其停止项目开发并移除所有相关资产。继今年2月对Yuzu模拟器提起诉讼并获得240万美元赔偿后,近日又成功迫使Ryujinx模拟器项目关闭,并已掌控Ryujinx官网域名。

2024-11-12 10:20:48 416

原创 DeepMind今日发布并开源其最先进AI蛋白质预测工具AlphaFold3程序代码

DeepMind的研究人员还反驳了一些批评者的说法,称《自然》杂志上的论文是可以重复的,因为有多个团队已经基于伪代码开发了自己的AlphaFold3版本。《自然》杂志主编玛格达莱娜·斯基珀在今年5月的声明中没有具体说明为何放弃了分享完整代码的要求,但她提到编辑们考虑了“生物安全的潜在影响以及由此带来的伦理挑战”。然而,他们对技术的发布方式提出了批评:尽管《自然》杂志的编辑指南要求发表的研究必须提供计算代码,但该论文仅提供了“伪代码”——即程序运行步骤的描述——以及一个每天只允许有限次数预测的在线门户链接。

2024-11-12 10:15:52 1243

原创 Linux 6.13 将提供对一系列 Pre-M1 苹果设备的基本支持

即将到来的 Linux 6.13 合并窗口将支持大量旧版 Apple SoC 和板卡,但这只是最基本/初始形式的支持。虽然不像苹果 M3/M4 设备支持上游主线 Linux 内核那样令人兴奋,但对于那些拥有一些较旧的苹果(M1 之前)设备的用户来说,即将发布的 Linux 6.13 内核将支持一些较旧的 SoC 和板卡。虽然看到这些新增功能令人激动,并为在这些较旧的 Apple ARM 设备上运行 Linux 开辟了道路,但这里必须重申,这只是能够启动主线 Linux 内核的最基本/最基本的支持。

2024-11-12 08:04:51 408

原创 计算机视觉和机器人技术中的下一个标记预测与视频扩散相结合

"序列模型的目的是以已知的过去为条件,预测未知的未来,这是一种二进制掩蔽。在测试时,我们的系统可以 "解除 “标记集合的屏蔽,并在不久的将来以较低的噪音水平扩散一个序列。在求解二维迷宫的任务中,Diffusion Forcing 的表现优于六种基线方法,它能更快地生成通往目标位置的计划,这表明它可以成为未来机器人的有效规划器。这一名称来源于 “教师强迫”(Teacher Forcing),它是一种传统的训练方案,将完整的序列生成分解成更小、更容易的下一个标记生成步骤(就像一位好老师简化复杂的概念一样)。

2024-11-11 21:31:19 1355 1

原创 X 正在测试免费版人工智能聊天机器人 Grok

上周末,一些应用程序研究人员和用户发布了关于向某些地区的用户提供免费版 Grok 的消息。通过向免费用户开放 Grok,xAI 可能是在寻求更重要的用户群和更快的产品反馈周期,以便更好地与市场上的其他模式(如 ChatGPT、Claude 和 Gemini)竞争。据一位在 X 上以 Swak 命名的研究人员称,目前的使用是有限制的: Grok-2 型号每两小时 10 次查询,Grok-2 mini 型号每两小时 20 次查询,每天 3 个图像分析问题。上月底,该公司又赋予了该模型理解图像的能力。

2024-11-11 21:23:28 462

原创 即梦AI宣布Seaweed视频生成模型开放使用

Pro版模型能实现自然连贯的多拍动作与多主体复杂交互,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,适配电影、电视、电脑、手机等各种设备的比例,可以更好地服务于专业创作者和艺术家们,应用于设计、影视、动画等内容场景,助力想象力的实现和故事创作。平台相关负责人表示,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,通过开放豆包视频生成模型的使用和持续升级平台各项AI能力,即梦AI希望成为用户最亲密和有智慧的创作伙伴。

2024-11-11 10:10:20 819

原创 AMD-OLMo:在 AMD Instinct MI250 GPU 上训练的新一代大型语言模型。

AMD-OLMo是一系列10亿参数语言模型,由AMD公司在AMD Instinct MI250 GPU上进行训练,AMD Instinct MI250 GPU是一个功能强大的图形处理器集群,它利用了OLMo这一公司开发的尖端语言模型。AMD 创建 OLMo 是为了突出其 Instinct GPU 在运行 “具有数万亿标记的大规模多节点 LM 训练工作 ”方面的能力,与其他完全开放的类似规模的 LM 相比,OLMo 可实现更高的推理和指令跟踪性能。

2024-11-10 11:58:26 1392

原创 Monetico: 文本到图像合成的革命性变革

由 Collov Labs 开发的 Monetico 是文本到图像合成领域的变革者。它能够生成高质量的图像,同时具有易用性和高效性,是创意专业人士和爱好者的重要工具。随着人工智能技术的不断发展,Monetico 通过数字艺术和设计将创意变为现实,证明了创新的力量。🤗🤗🤗。

2024-11-10 10:14:11 811

原创 泄露的文档显示 Google 似乎意识到了 Tensor 处理器存在过热问题

Android Authority 泄露的幻灯片显示,过热是基于 Tensor 的 Pixel 手机退换货的首要原因,显然,28% 的用户投诉与这些手机的发热程度有关。Google还决定跳过较小的 Cortex-A5xx 核心,以保持结构更简单,不过,较少的核心意味着 G6 的速度可能不会比 G5 有很大的提升。Google 知道其 Tensor 芯片存在一些问题,尤其是在过热和电池寿命方面,显然他们正在努力通过即将推出的代号为"Malibu"的 Tensor G6 来解决这一问题。

2024-11-10 08:28:43 356

原创 BAAI 的 Aquila-VL-2B-llava-qwen: 促进视觉语言理解

在人工智能领域,北京人工智能学会(BAAI)做出了重要贡献: 在人工智能领域,北京人工智能研究所(BAAI)开发的 Aquila-VL-2B-llava-qwen 模型做出了重大贡献。这一创新模型建立在 LLava-one-vision 框架之上,展示了视觉语言模型(VLM)在理解和处理视觉和文本数据方面的潜力。

2024-11-09 17:19:28 1452

原创 黄仁勋:AI数据中心可扩展至百万芯片 性能年翻倍,能耗年减2-3倍

黄仁勋表示,没有任何物理定律可以阻止将AI数据中心扩展到一百万个芯片,尽管这是一个难题,多家大公司包括OpenAI、Anthropic、Google、Meta和微软等,都在争夺AI领域的领导地位,竞相攀登技术的高峰,但重新创造智能的潜在回报是如此之大,以至于不能不去尝试。我认为,AI不仅能够帮助我们处理复杂的数据和决策任务,还能提升我们的创意思维和工作效率,成为每个人工作中不可或缺的一部分。这是我们推动AI前进的一大步。然而,随着物理极限的接近,摩尔定律的速度开始放缓,芯片性能提升的瓶颈逐渐显现。

2024-11-09 12:10:05 983

Agent Q.pdf-Agent Q: Advanced Reasoning and Learning for Autono

Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents

2024-08-29

Grok-314B模型磁力链接

Grok-314B模型磁力链接

2024-03-18

image模型,yolov3.pt

image模型,YOLOv3 (Size = 237 mb, moderate performance and accuracy, with a moderate detection time)

2023-01-12

image模型,tiny-yolov3.pt

image模型,(Size = 34 mb, optimized for speed and moderate performance, with fast detection time)

2023-01-12

retinanet-resnet50-fpn-coco-eeacb38b.pth

Imageai模型,RetinaNet (Size = 130 mb, high performance and accuracy, with longer detection time)

2023-01-12

densenet121-a639ec97

ImageAI模型,DenseNet121 by Facebook AI Research (Size = 30.8 mb, slower prediction time and highest accuracy)

2023-01-12

inception-v3-google-1a9a5a14.pth

ImageAI模型,InceptionV3 by Google Brain team (Size = 103 mb, slow prediction time and higher accuracy)

2023-01-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除