自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(644)
  • 收藏
  • 关注

原创 Llama 3.2:利用开放、可定制的模型实现边缘人工智能和视觉革命

在我们发布 Llama 3.1 模型群后的两个月内,包括 405B - 第一个开放的前沿级人工智能模型在内,它们所产生的影响令我们兴奋不已。虽然这些模型非常强大,但我们也认识到,使用它们进行构建需要大量的计算资源和专业知识。我们也听到一些开发人员说,他们没有这些资源,但仍然希望有机会使用 Llama 进行构建。正如 Meta 创始人兼首席执行官马克-扎克伯格(Mark Zuckerberg)今天在 Connect 大会上所分享的,他们不必再等待了。

2024-09-26 09:16:42 798

原创 啊?不会这就是草莓吧?OpenAI发布最新模型——OpenAI o1-preview

解决难题的全新系列推理模型。9.12 开始提供我们开发了一系列新的人工智能模型,旨在花更多时间思考后再做出反应。与以前的科学、编码和数学模型相比,它们可以推理复杂的任务,解决更难的问题。今天,我们将在 ChatGPT 和我们的应用程序接口中发布该系列的第一个模型。这是一个预览版,我们期待定期更新和改进。在发布此版本的同时,我们还将对目前正在开发中的下一次更新进行评估。

2024-09-13 08:16:23 1311

原创 【AI绘画】FLUX:这款新的人工智能图像生成器非常善于创造人手

Black Forest Labs 发布了三种 FLUX.1 文本到图像模型:高端商业 "pro "版、非商业使用的中端开放权重 "dev "版和更快的开放权重 "schnell "版("schnell "在德语中意为快速)。Black Forest Labs 声称,其模型在图像质量和文本提示的遵从性等方面优于 Midjourney 和 DALL-E 等现有选择。

2024-08-04 09:26:03 1996 1

原创 如何快速下载huggingface大模型

Stackoverflow 上有个AI开发入门的最常见问题 How to download model from huggingface?,回答五花八门,可见下载 huggingface 模型的方法是十分多样的。其实网络快、稳的话,随便哪种方法都挺好,然而结合国内的网络环境,断点续传、多线程下载等特性还是非常有必要的,否则动辄断掉重来很浪费时间。基于这个考虑,对各类方法做个总结和排序:

2024-08-03 12:35:19 1464

原创 Meta推出全新大语言模型“Llama 3.1”

Meta公司高管表示,该模型主要用于为Meta公司内部和外部开发者的聊天机器人提供动力,并拥有广泛的新功能,包括改进的推理能力,可以帮助解决复杂的数学问题或立即提取一整本书的要点。“我认为,对于人工智能助手来说,最重要的产品将是它有多智能,”扎克伯格在接受系列节目The Circuit with Emily Chang的采访时表示,“我们正在打造的Llama模型是世界上最先进的模型。扎克伯格希望开放使用的策略将推动该公司的产品成为其他成功初创企业和产品的基础,令Meta在行业的远期发展中拥有更大的影响力。

2024-07-24 09:41:14 646

原创 大教堂和小集市正在AGI上上演

世界上的建筑可以分两种:一种是集市,天天开放在那里,从无到有,从小到大;还有一种是大教堂,几代人呕心沥血,几十年才能建成,投入使用。当你新建一座建筑时,你可以采用集市的模式,也可以采用大教堂的模式。一般来说,集市的特点是开放式建设、成本低、周期短、品质平庸;大教堂的特点是封闭式建设、成本高、周期长、品质优异。而AGI正分为两派:闭源企业派和开源自由派。但无论哪种形式,都将推动着ML走向全新的高位宇宙。

2024-05-31 10:30:20 1126

原创 【全网瞩目】OpenAI春季发布会结束,一夜过后又惊喜——GPT4O,新的 LLM 标准诞生了

虽然昨天我就一直关注到OpenAI的主页提示,即将发布春季直播,而且也有很多媒体透露没有Sora,可能是AI Search等等,但是没想到结果还是这么惊喜。就连OpenAI方面也在直播前几天透露,不是搜索引擎,而是GPT的优化。然而,OpenAI在主打产品AI模型上花了更多心思,拓展多模态功能,让用户可以免费玩转文字、图片和语音输入。

2024-05-14 09:01:17 889

原创 【全网瞩目】你想知道的Llama3都在这里

Meta发布了开放式生成人工智能模型 Llama 系列的最新产品: Llama 3。或者更准确地说,该公司首次发布了其新的 Llama 3 系列中的两个模型,其余模型将在未来某个不确定的日期发布。

2024-04-19 10:56:40 1247

原创 大算力时代已经到来

计算机发展到现在,早已经历了大数据时代,而现如今国家也注意到国民大数据的重要性,而给予保护性条款和制度的建立。我觉得这只是早已注定的结局,但是未来该走向何方,着眼当下,我们互联网人早已身处在答案之中——大算力(Big Computing Power)时代。回顾2019年,Nvidia宣布下一代的的显卡将会具备光追技术。而在随后2020年,区块链大佬就发现Nvidia的系显卡对原系算力的提升有着难以置信的显著表现。就此大算力时代也彻底拉开了序幕。当然,许多3A大作也可以在4k画质下突破百帧。随后,AMD也在2

2022-08-06 17:58:32 1251

原创 一个程序员应怀揣武侠梦

一个程序员应怀揣武侠梦在美国的硅谷,许多有梦想的青年都有着一份属于自己的美国梦。在他们的眼中,总会让人感受到一种想要改变世界的朝气。难道其他地方的青年们没有属于自己的梦想吗?答案明显是每个人都拥有着。我从小就被金庸先生和古龙先生笔下的“江湖”给深深的吸引着。在那里,权贵并不重要,更重要的是友情、亲情、国士无双的情怀。每一个身处在江湖中的人都始终贯彻着属于自己的人生信条。我觉得这样的人一定很热爱这个江湖。相比之下,计算机行业也是一种“江湖”。在AT&T的肯•汤普森先生和丹尼斯•里奇先生创作出 Un

2021-03-07 17:47:51 357 1

原创 日本科学家利用AI技术在秘鲁纳斯卡沙漠地区找到303幅古代地画

日本山形大学考古学家酒井正人23日在秘鲁首都利马宣布了这一新发现,他表示:“AI在研究中的应用使我们能够更快、更精确地绘制出地画的分布图。传统方法是在空中通过从广阔区域收集的高分辨率图像中识别地画,不仅速度慢,而且有遗漏的风险。”酒井正人称,这一发现是山形大学的纳斯卡线条研究所与IBM公司研究部门合作的成果。考古人员借助AI模型圈定了地画存在可能性较高的区域后,仅用6个月就新发现了303幅描绘野生动物的地画。据报道,纳斯卡地画是2000多年前制作的,包括“刻”在沙漠地区地面上的一系列巨大图案。

2024-09-26 11:05:30 101

原创 ByteDance 在多主体互动方面取得突破,打破了视频生成竞赛的格局

9 月 24 日,ByteDance 的技术部门火山引擎(Volcano Engine)推出了两款先进的视频生成模型 PixelDance 和 Seaweed,通过复杂的多镜头动作和多个主体之间的复杂互动,显著增强了视频内容创建能力。此外,虽然目前的行业标准将 TPM(每分钟代币数)上限设定为 300K 至 100K,不足以满足某些企业应用的需求,但豆包模型的初始容量为 800K,远远超过这些标准,并可根据客户需求进行扩展。随着企业应用的扩大,支持更高的流量已成为行业增长的关键因素。

2024-09-26 08:17:31 92

原创 理解和使用语言模型的监督微调 (SFT)

监督微调(SFT)是 LLM 对齐过程中的第一个训练步骤,实际上非常简单。首先,我们需要策划一个高质量 LLM 输出数据集–这些数据集基本上就是 LLM 表现正确的示例;见下文。然后,我们直接通过这些示例对模型进行微调。在这里,微调的 "监督 "意义来自于我们正在收集模型应该模仿的示例数据集。然后,模型在微调过程中学会复制这些示例的风格。与下一个标记预测的关系 有趣的是,SFT 与语言模型预训练并无太大区别–预训练和 SFT 都将下一个标记预测作为基本训练目标!主要区别在于使用的数据。

2024-09-26 06:00:00 1205

原创 AI正在学习读懂你的情绪 为什么这是件好事?

人工智能能够理解人类的情感,并能根据人类的情感输入进行适当的互动,这对于人机交互来说是革命性的,也是评估个人心理健康状况的关键。心率变异性和皮肤电反应等其他情绪唤醒测量也是将无形的"情绪"转化为模式和可识别、可读数据的工具,供人工智能学习和改进。此外,确保人工智能能够适应各种文化的细微差别也是至关重要的,因为这将保持人工智能的完整性和可靠性,以便将来进行参考和学习。"我们相信,人工智能、心理学、精神病学和其他领域之间的跨学科合作将是实现这一目标的关键,也是释放情感量化的全部潜力、造福社会的关键,"刘说。

2024-09-26 06:00:00 247

原创 OpenAI推出高级语音模式 提供更多语音和全新外观

OpenAI 在春季更新中展示了 Sky 的声音,但在这一阵容中缺少了 Sky 的声音,这导致斯嘉丽-约翰逊(Scarlett Johansson)发出了法律威胁。这次推出的另一项功能缺失了:ChatGPT 的视频和屏幕共享功能是 OpenAI 在四个月前的春季更新中首次推出的。在演示过程中,OpenAI 的一位工作人员向大家展示了如何向 ChatGPT 提出实时问题,比如面前纸张上的数学问题,或者电脑屏幕上的代码问题。在我们对 AVM 的测试过程中,我们发现故障并不少见,但该公司称现在已经有所改善。

2024-09-25 10:37:43 252

原创 Google发布改进型Gemini 1.5 系列AI模型 并将API价格降低50%

最后,Google发布了名为"Gemini-1.5-Flash-8B-Exp-0924"的改进版 Gemini 1.5 模型。更新后的 Gemini 1.5 系列模型在 MMLU-Pro 基准成绩提高了约 7%,在 MATH 和 HiddenMath 基准中提高了约 20%,在视觉和代码用例中提高了约 2-7%。现在,两个模型的响应风格都更加简洁。Google今天发布了两款可投入生产环境的更新版Gemini 1.5 型号:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。

2024-09-25 10:36:08 278

原创 PDF一键转播客!PDF2Audio让文档“开口说话“

同时,PDF2Audio提供了多种内容模板,包括播客、讲座和摘要等,用户可以根据自己的需求选择最合适的模板,轻松将学术论文、行业报告或个人笔记转化为易于理解的音频格式。用户只需通过简单的操作,就能将枯燥的文字资料变成生动有趣的有声内容。近日,一款名为PDF2Audio的开源工具应运而生,它巧妙地将人工智能技术与传统阅读方式相结合,为用户提供了一种全新的信息获取方式。用户可以多次修改生成的脚本,并提供具体反馈,系统会根据这些意见不断优化音频内容,最终呈现出令人满意的结果。

2024-09-25 08:53:29 152

原创 微软宣称其新工具可纠正人工智能幻觉 但专家依然对此表示怀疑

玛丽皇后大学专门研究人工智能的研究员迈克-库克(Mike Cook)认为,即使"Correction"能像宣传的那样发挥作用,它也有可能加剧人工智能的信任和可解释性问题。在被问及有关 Correction 模型的背景介绍时,该发言人指出,微软研究团队最近发表了一篇论文,描述了这些模型的预生产架构。如果检测到幻觉,分类器就会引入第二个模型,即语言模型,试图根据指定的"基础文件"纠正幻觉。毕马威会计师事务所(KPMG)的一项民意调查显示,在试用人工智能工具时,准确性和可能出现的幻觉是企业目前最担心的问题。

2024-09-25 06:23:28 828

原创 什么是启发式过滤(Heuristic Filtering)?

启发式过滤是一种在包括计算机科学和网络安全在内的各个领域中用于识别模式并根据一组规则和算法做出决策的技术。在垃圾邮件过滤器或防病毒软件的上下文中,启发式过滤用于根据其特征识别可疑电子邮件或文件,即使以前未将其识别为恶意。

2024-09-25 06:05:35 738

原创 Cloudflare为网站添加AI审计 可检查AI爬虫何时抓取和抓取频次以及直接屏蔽爬虫

此外 Cloudflare 还计划在明年推出交易市场,允许网站管理员设置自己网站的内容抓取价格,AI 公司如果愿意的话可以付费获取抓取权限,如果不愿意付费那网站就可以通过 Cloudflare 一键拦截爬虫阻止内容被抓取。其中 AI 审计工具中的禁止抓取与 Cloudflare 已经提供的一键禁止所有 AI 爬虫抓取不同,在 AI 审计工具中网站管理员可以分门别类的进行审计和屏蔽。

2024-09-25 06:04:46 295

原创 Sam Altman最新博文:智能时代将带来无限的智能和丰富的能源

Altman 用简洁的语言概述了 AI 进步的关键因素 —— 深度学习这一技术成功并不断在规模扩展的过程中取得可预测的进展,这一突破将促使 AI 在解决复杂问题上的能力越来越强,从而推动科学、技术和经济的持续发展。这是看待人类历史的一种狭隘方式:在数千年的科学发现和技术进步的积累之后,我们已经弄清楚了如何将沙子融化,加入一些杂质,然后以惊人的精确度在极其微小的尺度上排列成计算机芯片,运行能量,通过这些芯片创造出越来越有能力的 AI 系统。进步的故事将继续,我们的孩子将能够做一些我们无法做到的事情。

2024-09-24 12:53:46 653

原创 清华大学开源视频转文本模型——CogVLM2-Llama3-Caption

通常情况下,大多数视频数据并不附带相应的描述性文本,因此有必要将视频数据转换为文本描述,为文本到视频模型提供必要的训练数据。CogVLM2-Caption 是一个视频字幕模型,用于为 CogVideoX 模型生成训练数据。

2024-09-24 09:00:02 300

原创 清华大学开源 CogVideoX-5B-I2V 模型,以支持图生视频

CogVideoX 是源于清影的开源视频生成模型。下表列出了我们在此版本中提供的视频生成模型的相关信息。FP16BF16。

2024-09-24 08:46:30 1112

原创 微软宣布弃用面向企业的WSUS更新服务 仍然保留该服务但不再添加任何新功能

Windows Server Update Services 是微软面向企业推出的一项更新服务,该服务已经存在很多年,允许 IT 管理员控制内网设备的更新节奏。到 2027~2028 年也就是下一次 Windows Server 更新的时候大概率 WSUS 是不会被支持了,到时候微软可能会选择彻底关闭该服务,不再支持使用 WSUS 部署更新。但让人没想到的是现在微软竟然宣布弃用 WSUS 更新服务本身,该服务接下来不再接受任何新的功能请求,微软也不会再对该服务进行任何开发。

2024-09-24 06:52:26 255

原创 微软推迟在MDM设备上启用OOBE强制更新 因为IT管理员反馈称缺乏控制

微软很久之前就计划在 Windows 10/11 OOBE 期间强制下载更新,即若检测到系统本身属于旧版本例如并未安装最新累积更新,则在 OOBE 期间强制下载最新累积更新并自动安装。然而所谓客户最希望实现的功能可能只是微软的单方面说法,因为在启用这个更新机制后,不少 IT 管理员抱怨该机制缺乏控制,即 IT 管理员无法干预设备安装哪些更新。在 OOBE 期间强制更新的好处在于,客户第一次登录桌面系统就是最新状态,这意味着安全性方面不受威胁,也不需要在进入系统里再部署更新。

2024-09-24 06:00:00 223

原创 [教程]如何在iPhone上启用中国移动/联通/电信RCS消息

RCS 消息需要依赖网络进行传递,若因为网络其他原因导致 RCS 消息未发送成功,则系统会自动将其以短信形式发送,这种情况是要对短信进行收费的,比如国内运营商通常是 0.1 元 / 条短信。不过考虑到现在大家发送短信的情况已经非常少,所以无论是否支持 RCS 消息,可能对国内用户来说都没有太大区别,只是希望 RCS 消息或者 5G 消息不要变成垃圾信息的新阵地就好。启用后在发送短信时输入框会显示 信息・RCS,如果显示的信息・短信则说明该卡号未激活 RCS。在 RCS 信息里将你使用的手机卡都开启即可。

2024-09-23 19:52:30 485

原创 数据中心里全速运行的处理器正在浪费能源

为支持这一观点,Uptime 引用的基准数据显示,当服务器被限制在较低的性能状态时,往往是最节能的。不过,Uptime 认为,除了高频交易等对延迟非常敏感的工作负载外,对大多数工作负载来说,这样做的性能影响可以忽略不计。事实上,现代处理器提供的性能往往超过了可接受的服务质量所需的性能,全速运行可能会浪费能源。尽管在性能上有所折衷,但 Uptime 认为功耗应该是大多数用例的主要关注点,在整个数据中心最大限度地提高性能并启用这些功能,可以节省大量能源和成本。

2024-09-23 09:19:48 397

原创 Apple Intelligence预计会在iOS 18.1和iOS 18.4之间按此顺序推出

来自“信息”、“邮件”和许多其他 App 的通知摘要“信息”和“邮件”App 中的建议回复“照片”App 中的新“清理”工具,该工具可以从照片中移除不需要的人或物体,并使用生成式 AI 填补背景通过输入描述在“照片”App 中创建回忆录影片的能力。

2024-09-23 09:17:05 1334

原创 Linus Torvalds解释为什么Linux开发人员趋向老龄化反而是件好事

不过,从 Linux诞生至今已有 33 年,托瓦尔兹仍然是内核的核心维护者,并得到了数以万计的贡献者的支持,这些贡献者有来自依赖 Linux 的企业,也有来自本土的贡献者,比如 Linux 基金会的研究员格雷格-克罗阿-卡曼(Greg Kroah-Kartman),他负责领导 Linux 内核的稳定发布。一直以来,Linux 都是以 C 语言为中心的内核,但在 2022 年,该项目正式推出了对 Rust 的支持,Rust 是一种通用的开源编程语言,得到了许多大牌科技公司的支持。

2024-09-23 09:11:42 410

原创 Anthropic介绍Contextual Retrieval

上下文检索通过在嵌入之前将块特定的说明上下文添加到每个块(“上下文嵌入”)并创建BM25索引(“上下文BM25 ”)来解决此问题。让我们返回我们的SEC文件收集示例。值得注意的是,过去已经提出了使用上下文来改善检索的其他方法。其他建议包括: 将通用文档摘要添加到大块(我们进行了实验,发现收益非常有限), 假设文件嵌入,和 基于摘要的索引(我们进行了评估,发现性能低下)。这些方法与本文中提出的方法不同。

2024-09-22 08:44:11 1157

原创 扎克伯格的未来愿景 用智能眼镜引领数字社交互动新时代

无论未来如何,可以肯定的是,技术将继续改变我们的社交互动,而 Meta 正在这场变革中扮演着至关重要的角色。在即将召开的 Meta Connect 2024 大会之前,对公司创始人马克-扎克伯格(Mark Zuckerberg)进行了长达 90 分钟的播客采访,对 Meta 的未来发展方向和愿景进行了阐述。他认为,智能眼镜将是实现这一目标的重要工具。最后,扎克伯格重申了 Meta 的愿景:在大型人工智能模型和智能眼镜方面,他们的目标是建立一个开放的生态系统,让开发者和创新者可以自由地创造出优秀的产品。

2024-09-22 06:30:00 294

原创 OpenAI o1-preview和o1-mini现已在 GitHub Copilot和GitHub Models中提供

在将 o1-preview 与 GitHub Copilot 一起使用时,GitHub 团队注意到该模型的推理能力可以更深入地理解代码约束和边缘情况,从而产生更高效、更高质量的结果。有了这个新的预览版,开发人员可以在 VS Code 中选择 o1-preview 或 o1-mini 来支持他们的 Copilot 聊天体验,而不是当前的默认模型 GPT-4o。与此相关,OpenAI最近提高了面向开发者的 o1-preview 和 o1-mini API 的速率限制。

2024-09-21 10:04:04 704

原创 《微软飞行模拟2024》储存空间需求仅不到前作的1/5

开发商 Asobo Studio 的首席执行官 Sebastian Wloch 表示:“非常重要的事,总体贷款消耗大幅下降,因为您指挥下载真正会看到的内容,而我们不会预先下载数百 GB 的数据……公司还指出,续作将为飞行员们的空中冒险提供更多细节,同时也意味着将使用智能的方式节省空间,例如在美国上空时,游戏将无需在玩家上安装其他地区的内容。根据微软在最新一期 Xbox Wire 中的介绍,将于今年11 月登陆 Xbox Series X|S 主机的《微软飞行模拟2024》将比前作占用空间小很多。

2024-09-21 06:30:00 225

原创 微软 GRIN-MoE 人工智能模型挑战编码和数学,在关键基准测试中击败竞争对手

微软发布了一个突破性的人工智能模型–GRIN-MoE(Gradient-Informed Mixture-of-Experts),旨在提高编码和数学等复杂任务的可扩展性和性能。该模型每次只选择性地激活一小部分参数,从而使其既高效又强大,有望重塑企业应用。GRIN-MoE 在研究论文 "GRIN:GRadient-INformed MoE "中作了详细介绍,它采用了一种新颖的专家混合(MoE)架构方法。

2024-09-21 06:15:00 1257

原创 任天堂发言人:不会透露起诉《幻兽帕鲁》开发商细节

任天堂在昨天突然宣布将起诉《幻兽帕鲁》开发商 Pocketpair,除了引起许多玩家不满外,更多的是所有人的疑惑:因为实际上大家内心里觉得任天堂出手是理所当然的,但是为什么是在游戏发布数月后才选择起诉?此次诉讼是“专利侵权”而非“侵犯版权”,那么到底 Pocketpair 在不知情的情况下使用了什么专利?根据一位任天堂发言人在接受媒体 Nintendo Life 的询问的回应,我们能够知道第一个问题的答案:显然任天堂花费了很长时间,仔细研究《幻兽帕鲁》后找到了一些可以确实让他们胜诉的问题。

2024-09-20 15:54:31 236

原创 OpenAI面向开发者继续提高o1系列模型的调用速率 最高每分钟可调用1000次

早前 OpenAI 推出基于 o1 系列的新模型,分为 o1-preview 预览版和更快更便宜的 o1-mini 版,该系列模型的主要特点是可以解决更复杂推理任务。此次调整前 o1-preview 模型的调用速率为每分钟 100 个请求,o1-mini 的调用速率则是每分钟 250 个请求;今天 OpenAI 宣布提高 Tier 5 开发者的 o1 系列模型调用速率,鼓励更多开发者积极使用 o1 系列模型,但目前这仅适用于 5 级开发者,后续 OpenAI 会陆续扩展支持 1~4 级开发者。

2024-09-20 15:45:27 338

原创 阿里吴泳铭:生成式AI的真正价值不是做超级应用,而是直击物理世界!

在当前生成式AI的热潮中,这种现象尤为明显。随着时间推移,这项技术将如春风化雨般渗透到我们生活的方方面面,从根本上改变我们与周遭世界的关系。未来,我们可能不再局限于通过屏幕与程序交互,而是能够借助这种智能技术直接与物理世界展开对话,创造出前所未有的体验和可能性。然而,阿里巴巴的吴泳铭却提出了一个更为深远的洞见:生成式AI的真正价值并非仅限于创造炫目的应用,而是在于彻底改变我们与物理世界的互动方式。就像种子在地下默默生长,真正的变革力量也在时间的长河中悄然孕育,直到某一天突破地表,呈现出惊人的生命力。

2024-09-20 09:23:41 152

原创 快手可灵AI全球升级1.5模型:引入“运动笔刷”功能 画质大幅提升

截至目前,可灵AI已累积超过260万用户,生成了超过2700万个视频和5300万张图片,成为全球AI视频生成领域的领先者。与之前的1.0模型相比,1.5模型在画面质量、动态效果和文本响应度等方面均有显著提升,内部评测显示整体效果提升了95%。除了上述升级,可灵AI还推出了一系列其他功能,包括支持一次性生成多条视频、增加视频时长、支持画质增强等。在动态质量方面,新模型通过更真实的物理表现和自然流畅的动作,增强了视频的动态效果。为了进一步提升视频生成的精准控制能力,可灵AI引入了全新的“运动笔刷”功能。

2024-09-20 09:21:52 243

原创 上海AI气象大模型提前6天预测“贝碧嘉”台风登陆浦东 今年已多次精准预测

其中,今年第13号台风“贝碧嘉”(强台风级)的中心于9月16日7时30分前后在上海浦东临港登陆,一路向西横扫上海,成为1949年有记录以来正面登陆上海的最强台风。“除成功预报此次台风‘贝碧嘉’的移动轨迹之外,从今年汛期降水实时预报结果来看,伏羲大模型也曾提前8天以上精准预测河南南阳特大暴雨、提前15天以上预测湖南华容县洞庭湖决堤事件。据介绍,目前风乌大模型将提前72小时台风路径预报精度较经典方法提升25%以上,可在单张显卡上运行,30秒即可输出未来10天的全球气象预报结果。

2024-09-20 06:15:00 258

原创 谷歌论文提前揭示o1模型原理:AI大模型竞争或转向硬件

基于论文提出的计算最优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在一些任务上可以超越一个14倍大的模型。在AI领域,谁能拥有更强大的算力,谁就可能在下一阶段的竞争中占据优势。仅在OpenAI发布最新推理模型o1几日之后,海外社交平台 Reddit 上有网友发帖称谷歌Deepmind在 8 月发表的一篇论文内容与o1模型原理几乎一致,OpenAI的护城河不复存在。o1模型在给出答案之前,会生成一系列中间推理步骤,不断完善自己的思维过程,尝试不同的策略,并能识别自身错误。

2024-09-20 06:00:00 570

Agent Q.pdf-Agent Q: Advanced Reasoning and Learning for Autono

Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents

2024-08-29

Grok-314B模型磁力链接

Grok-314B模型磁力链接

2024-03-18

image模型,yolov3.pt

image模型,YOLOv3 (Size = 237 mb, moderate performance and accuracy, with a moderate detection time)

2023-01-12

image模型,tiny-yolov3.pt

image模型,(Size = 34 mb, optimized for speed and moderate performance, with fast detection time)

2023-01-12

retinanet-resnet50-fpn-coco-eeacb38b.pth

Imageai模型,RetinaNet (Size = 130 mb, high performance and accuracy, with longer detection time)

2023-01-12

densenet121-a639ec97

ImageAI模型,DenseNet121 by Facebook AI Research (Size = 30.8 mb, slower prediction time and highest accuracy)

2023-01-12

inception-v3-google-1a9a5a14.pth

ImageAI模型,InceptionV3 by Google Brain team (Size = 103 mb, slow prediction time and higher accuracy)

2023-01-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除