自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1612)
  • 收藏
  • 关注

原创 20240824 每日AI必读资讯

DeepMind发论文解释了Vizier系统的机制,博客作者Mario Fischer还对近百份文档做了彻底的调研分析,为我们还原了这个互联网巨兽的全貌。- 用户只需登录 Google AI Studio,选择适合的提示词并输入需求,即可获得所需内容,极大地便利了用户的日常工作。- 北京航空航天大学开发出一种新型的昆虫级别的腿式微型机器人,称为BHMbot,它实现了超快的无缆奔跑速度。- 该机器人有两个独立控制的前腿,能够实现多种运动轨迹,例如圆形、矩形、字母形状,并能够跨越障碍物。

2024-08-24 15:40:09 385

转载 谷歌搜索引擎全面揭秘!近百份文档泄露,博主爆肝数周逆向工程

从爬虫系统、存储库Alexandria、粗排名Mustang,再到过滤和细排名系统Superroot以及负责最终呈现页面的GWS,这些都会影响网站页面最终的呈现和曝光。并且,由于机器学习的使用,自然搜索结果的结构非常复杂,以至于参与排名算法开发的谷歌员工也表示,他们并不能完全理解许多信号权重的相互作用,无法解释为什么某个结果会排在第一或第二。经过测试,Twiddler有多种用途,开发者可以尝试使用新的过滤器、乘数或特定位置限制,甚至可以做到非常精准的操控,将一个特定的搜索结果排名到另一个结果的前面或后面。

2024-08-23 17:04:48 22

原创 20240823 每日AI必读资讯

3、账号登录建议:建议用户使用Discord账号登录,以保留图像历史记录,或将Discord与Google账号合并,以便未来使用任一账号登录。- 通过利用“卡尔曼滤波”的原理,能够让低清晰度的视频变得更清晰,特别是让视频里的人脸看起来更清晰、更真实。- 强化了文本的准确性,非常适合制作带有长文本的图形设计,如贺卡、海报和社交媒体内容,甚至是网页设计。- 提供了多种风格选择,如现实主义、设计风格、3D 和动漫,并且显著提高了图像质量和文字渲染精度。- 同时推出免费试用计划,可能随时关闭。

2024-08-22 19:28:42 1529

转载 脑后插管打CS拼抢三杀!马斯克脑机接口最新进展,意念玩《黑神话》指日可待?

来看这段《CS 2》游戏录像,玩家打的,来自马斯克Neuralink公司的第二位志愿者Alex。开局“转角遇到爱”,反应很迅速,轻松拿捏。正面对刚也不落下风。当然了,录像中的队友和对手都是电脑操控的Bot,不是和真人玩家对战。不过怎么说呢,上个月他刚刚完成植入手术,现在就掌握到这个程度了,也是很厉害了。在植入脑机接口之前,这位不幸瘫痪的游戏爱好者只能打游戏。使用一种叫QuadStick的设备,几根吸管当“摇杆”和“按钮”,从移动切换到瞄准要松开吸管咬住另一根。

2024-08-22 17:51:59 706

原创 20240822 每日AI必读资讯

通过精细调校的 GPT-4o 模型,Genie 在上周二宣布的新 SWE-bench Verified 基准上取得了 43.8%的 SOTA 分数。Genie 在 SWE-bench Full 上也保持了 30.08%的 SOTA 分数,超越了其之前的 19.27%的 SOTA 分数,成为该基准历史上最大的改进。1、生成用户界面(UI):如果你请求v0生成某种类型的UI(如表单、按钮、布局等),它可以为你编写相应的代码,并生成UI的代码片段。

2024-08-21 19:05:15 1891

原创 20240821 每日AI必读资讯

更好的文本/图片到视频生成效果:1.5 版本显著提升了视频生成效果和速度。能够在更短的时间内生成更高质量的视频。- xGen-MM 是 Salesforce 推出的一套开源多模态 AI 模型,支持文本和图像的综合理解与生成。- 72B版本的Qwen2-Math在数学测试集上表现出色,超过了GPT-4和NuminaMath模型。- 大幅提升图像生成质量:通过改进或优化模型和算法,使生成的内容更加精细、准确和高质量。- 更好的文本理解能力:增强了对文本到理解和生成能力,能生成更好和更准确的画面文字效果。

2024-08-21 00:23:47 2720

原创 20240820 每日AI必读资讯

8月19日正式发布的中国人形机器人Astribot S1,由初创公司星尘智能(Astribot)开发,8月21日到25日会在北京的世界机器人大会上直接亮相,对公众展示。通过这种方式,即使是现有的模型也可以生成超过20000字的文本。- S1在首次技术展示中,凭借熨叠衣、分拣收拾、颠锅、吸尘到竞技叠杯等几十个对机器人高难度,对人真有用的炫技动作,初登场就引发国内外不小讨论。- LongWriter是通过一种基于代理的“计划-写作”方法,将复杂的长文本生成任务分解为多个子任务,每个子任务只需生成一段文本。

2024-08-20 01:23:23 1091

转载 国产AI机器人好超前…弹琴泡茶打咏春,还能撸猫??

什么水平,让海外最火AI机器人Figure的CEO都第一时间关注?国产人形机器人大秀肌肉,最新技能居然是?!手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。熟练泡一壶功夫茶,、数个杯壶轻松拿捏。搞定一份香喷喷的华夫饼,最后还附送一个祖传颠勺。“闲情逸致”时还能带你,这不就是机器人版叶师傅?注意哦,以上操作都是机器人。不仅手超稳,而且各个动作行云流水、一气呵成,像吃了德芙般丝滑。

2024-08-20 01:04:38 165

原创 20240819 每日AI必读资讯

推出三款远征系列机器人产品:交互服务机器人「远征 A2」、柔性智造机器人「远征 A2-W」、重载特种机器人「远征 A2-Max」。最后的 One more thing 环节,智元 X-Lab 孵化的模块化机器人系列产品「灵犀 X1」和「灵犀 X1-W」也作为「彩蛋」正式亮相。- 五款机器人采用家族化设计语言,对机器人的外形进行了系列化的规整,结合轮式与足式两种形态,覆盖交互服务、柔性智造、特种作业、科研教育和数据采集等应用场景。- 提供超过400个3D场景和环境,用户可以在这些场景中进行专业级的拍摄。

2024-08-19 10:01:33 1724

转载 AI爆料人遭全网封禁!OpenAI等25个机构祭大招,一眼辨别AI机器人

人格凭证」这项技术究竟如何实现?这篇63页的论文能够给出我们非常详尽的答案。论文地址:https://arxiv.org/pdf/2408.07892首先,「人格凭证」以数字方式存储在持有者的设备中。为了保证可信度和隐私,PHC系统需要满足两个前提:- 每个人只能持有一份「人格凭证」,需要定期重新验证,以防被盗用- 持有PHC的用户与与服务提供商进行匿名交互。即使PHC发行商和服务提供商串通,也无法追踪用户的数字活动,更不能将用户在各个平台上的活动连接在一起。

2024-08-19 09:56:23 134

原创 20240818 每日AI必读资讯

比如,你可以描述一个场景,模型会根据你的描述生成一张复杂、有视觉冲击力的图片,比如一个穿着亮丽插画风衣的女人在日落的东京街头,周围环绕着烟雾、花朵和火焰等元素。- 可以通过详细的描述来提示模型生成复杂且视觉效果突出的图像,例如在充满活力的环境中呈现的戏剧性动作姿势,周围环绕着烟雾、花卉和火焰等各种插画元素。- 号称搜索结果相关性平均比谷歌学术高5倍,能搜索超1亿个研究对象,还不依赖LLM,测试结果Lumina搜索结果的相关性拿下SOTA。

2024-08-18 17:08:17 771

转载 稚晖君一口气发布5款人形机器人!开发者还能“0元购”

刚刚,“鸽”了一年的,终于带着新品来填坑了!没有什么比抽奖抽一台,更能体现对产品的自信了。2倍速现场主持人,也由此番发布的机器人亲自担当。一套小连招下来,网友们be like:B站科技区流量担当,诚不我欺(手动狗头)。尽管发布会只有短短1小时不到,但稚晖君和他背后公司智元机器人憋了一年,此番属实带来不少干货,先给大家伙做个小总结:发布远征A2系列人形机器人全栈开源灵犀X1系列机器人,主打一个“人形机器人人人造”自研关节模组实现量产化迭代升级,灵巧手自由度升级至19个。

2024-08-18 16:56:30 204

转载 奥运冠军竟是硅谷VC,还是哈佛学的计算机

哈佛计算机系学霸,首次参加奥运就拿下两块金牌!其中个人单项还是美国40年来首金。31岁公路自行车运动员(Kristen Faulkner) 最近意外火了。她毕业于哈佛大学,学的是计算机专业,在硅谷华尔街干了4年VC,24岁时因为参加俱乐部活动,才开始正式将骑车作为个人爱好。没想到7年后,她“临危受命”作为替补上场,意外成为最大黑马,直接拿下金牌。赛后采访中她透露,就连她自己也是在距离终点只有500米时才敢确定,“我能赢”。三天后,她又把。

2024-08-18 16:37:02 31

转载 3人干翻谷歌!免费学术搜索比谷歌学术相关性高5倍,已获YC投资

功能。比如用“机器学习”关键词搜索,它就会引用检索出来的论文总结介绍机器学习:点击AI概述中有下划线的关键词,就会触发对该关键词的进一步检索:

2024-08-18 16:06:09 399

原创 20240817 每日AI必读资讯

用户可以用一种语言进行查询,并在其他语言的数据中找到相应的结果。- 可以将视频自动翻译成其他语言并生成字幕,还能克隆视频中说话者的声音并自动配音,以及进行口型匹配。-LLM 翻译:结合领先的大语言模型(如GPT),快速且准确地进行翻译,确保翻译的专业性和自然性。-声音克隆:通过声音克隆技术,生成与原视频配音高度相似的语音,保持情感和语调的一致性。-口型同步:通保持口型同步,使配音与视频画面高度契合,提升视频的真实性和互动性。-灵活上传与翻译:用户可以上传视频,自主选择翻译语言和标准,确保个性化和灵活性。

2024-08-16 19:16:00 1726 1

原创 20240816 每日AI必读资讯

Agent Q 能够在没有明确训练数据的情况下,通过自主数据收集和学习,快速提高在新任务中的表现。- Agent Q 在执行任务的每一步都会进行自我评估,并根据反馈调整自己的行为。- 微调后的LLaMa 70B经过一天的自主对弈,性能从18.6%跃升至81.7%, 在线搜索成功率更是达到95.4%。- Agent Q 能够在复杂的任务中进行多步推理,通过自我规划和执行多个步骤来完成目标任务。- 即使不在可开放获取的存储库内,任何可在线阅读的内容,都很可能已经被输入LLM中。

2024-08-15 18:43:55 1823 1

转载 成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库

Claude深夜上新重磅功能——新版API可以“记住”一整本书或整个代码库,不需要再重复输入了。这样一来,不仅处理长文本的延时更低,更是能。来看看这降本的效果~

2024-08-15 18:13:39 92

转载 Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

依托arXiv大量且多样的论文收录,与之前的科学图片数据集相比,ArXivCap的数据量是第二名SciCap的3倍,ArXivQA也是唯一涵盖广泛领域内真实论文的问答数据集。与前面的基准测试结果相比,人工评估的结果并不理想,100个案例中只有16%被认为是「可接受的」,「上下文误读」的问题相对严重,也有一定比例的「过度简化」和「识别错误」。GPT-4V等视觉语言模型虽然在自然场景的图像中有出色的表现,但在解释抽象图片方面,比如几何形状和科学图表,依旧能力有限,也无法理解学术图片中细微的语义差别。

2024-08-15 18:10:20 202

原创 20240815 每日AI必读资讯

Pixel 9系列包括Pixel9、Pixel9Pro、Pixel9Pro XL和Pixel9Pro Fold,配备Tensor G4芯片,高内存容量,满足AI需求。- 谷歌 Pixel Studio 依赖谷歌 Tensor G4 SoC 芯片来生成图片,如果用户想要更优秀的内容,可以调用 Gemini 在云端生成图片。- Grok-2和Grok-2mini是重大升级,在聊天、编码和推理方面有突破性进展。- Gemini Live提供自由流畅的对话体验,支持免提使用,如口袋里的聊天助手。

2024-08-14 18:37:12 1538

转载 谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒

翻车,大翻车。就在今天凌晨,谷歌版Her——正式发布。毕竟明显是对标OpenAI家的GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的demo中,功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让Gemini查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而……当来到发布会现场演示环节的时候,画风却180°大变样。,时长01:43第一次:失败了。第二次:失败了。第三次:换手机,成功了。

2024-08-14 18:35:32 173

原创 20240814 每日AI必读资讯

该项目可以在聊天界面完成对 postgres 数据库的数据表设计,甚至支持向量数据类型,显示数据表的关系,所有表设计的修改都有历史记录可以跟踪。- 灵活的服务费用:企业可选择单独购买Face Check服务,每次验证费用为0.25美元,或免费试用Entra Suite每月包含8次免费的Face Check验证。- 数据分析与可视化:ChatGPT能够生成Python代码,帮助用户进行数据分析,并生成可视化图表,支持更复杂的数据分析任务如K-means聚类和蒙特卡洛模拟。

2024-08-14 01:21:27 2604

转载 最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人

继Devin之后,又一个被刷屏了——它叫,号称目前,已经可以像人一样思考和行动了!那么这个“地表最强”,到底强到什么程度?先来看下。在权威榜单SWE-Bench中,Genie以解决了问题的成绩夺得榜首。(SWE-Bench是一个用来评估大模型解决现实中软件问题的基准。而这个成绩可谓是遥遥领先第二名19.27%,解锁了至于Genie的首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。

2024-08-14 01:01:54 300

原创 20240813 每日AI必读资讯

支持多种大型语言模型,包括 OpenAI 的 GPT 系列、Anthropic 的 Claude、以及开源的 LLMs。- 这些动画不仅能跟随视频中的物体移动,还能自动调整大小和角度。- 通过滑动窗口分块技术,IncarnaMind能根据文档内容的复杂性和用户查询的需求,动态调整信息检索窗口的大小和位置。- 支持一次生成多张图片,以及视频输入输出功能,特别适用于抖音小程序端。- 转换后的小程序和 H5 页面均支持支付功能,可直接商业化。- 可以平衡获取更全面的上下文信息和精细的细节。

2024-08-13 00:11:22 1378

原创 20240812 每日AI必读资讯

在内容上,Transformer Explainer 紧密集成了对 Transformer 结构进行总结的模型概述,并允许用户在多个抽象层级之间平滑过渡,以可视化低级数学运算和高级模型结构之间的相互作用,帮助全面理解 Transformer 中的复杂概念。- 佐治亚理工学院和 IBM 研究院开发一款基于 web 的开源交互式可视化工具「Transformer Explainer」,帮助非专业人士了解 Transformer 的高级模型结构和低级数学运算。- Susan离世的消息,震惊硅谷。

2024-08-11 23:49:20 1306 1

转载 黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理

他们将工具进行结构化设计,以不同的抽象层次呈现信息。在最高层,工具展示了完整的处理流程:从接收用户提供的文本作为输入(图 1A),将其嵌入,经过多个 Transformer 块处理,再到使用处理后的数据来对最有可能的下一个 token 预测进行排序。在内容上,Transformer Explainer 紧密集成了对 Transformer 结构进行总结的模型概述,并允许用户在多个抽象层级之间平滑过渡,以可视化低级数学运算和高级模型结构之间的相互作用,帮助他们全面理解 Transformer 中的复杂概念。

2024-08-11 22:54:50 126

原创 20240811 每日AI必读资讯

可以根据音频、视频驱动生成与说话声音同步的嘴型视频,还可以将一个人的说话风格(如语气、节奏)迁移到另一个人身上。- 在换脸任务中,ReSyncer不仅能够保留目标身份的特征,还能实现更自然的表情和嘴型同步,使得换脸效果更加逼真。- 甚至还支持高质量的人脸交换功能, 可以在视频中替换说话者的面部,同时保持嘴部动作、表情与音频的同步。- 测试结果与现有的开源方法和Heygen等先进产品对比,有着最低的误差,其嘴型同步的精确度更高。- 靠LoRA技术改进了模型,大大增加了真实感,并简化了复杂的提示词。

2024-08-11 01:14:44 1466

转载 NeurIPS24评审结果遭全网吐槽,惊动LeCun!评审员打低分,严重贬低论文贡献

在这位AC负责的所有评审员中,有3位正教授,1位副教授,4位助理教授,9位业界专业人士,以及2位来自国家实验室的人员。还有人指出,在自己审阅的论文中,至少发现了3篇由大模型生成的评审意见,很可能还有更多,其中3篇明显是直接复制粘贴了ChatGPT输出,完全没有阅读论文。一个评审者混淆了我们方法的基线,另一个评审者混淆了基线的派生(正如我们的工作所批评的那样)和我们方法的派生。Reddit网友评论道,自己用一个月的时间审核6篇论文,当看到自己得到的是LLM的评价,真的很受伤。通常情况下,给6分就意味着拒稿。

2024-08-11 00:46:53 63

转载 超越恐怖谷!全球500万网友被骗,爆火TEDx演讲者没一个是真人?

除此以外,新团队曾经的创新成果包括创建VQGAN和潜在扩散(Latent Diffusion)、用于图像和视频生成的SD模型(SD XL 、SVD)以及用于超快速实时图像合成的对抗扩散蒸馏(Adversarial Diffusion Distillation)。- FLUX.1 [pro]:FLUX.1的顶级版本,提供最先进的图像生成,具有一流的提示词跟随能力、视觉质量、图像细节和输出多样性。比如人的舌头不会动,牙齿有些弯曲、扁平,第4秒时左臂出现了奇怪的斑点,还有Google标志处的bug,也非常明显。

2024-08-11 00:34:42 365

原创 20240809 每日AI必读资讯

在多个数学基准测试中数学能力显著超越了开源模型包括Llama-3.1-405B,甚至超过了闭源模型 (包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro )。大多数方法要么在图像的像素层面上逐步生成,要么通过先训练一个压缩图像的模型,再在低分辨率的图像上进行处理。- 研究表明,这种方法可以生成分辨率高达 1024x1024 像素的图像,并且即使使用相对较少的数据,它也能很好地生成出符合要求的图像。- 能够在说话的同时也能听到外界的声音,从而支持实时的语音交互。

2024-08-09 18:33:23 1389

转载 乒乓球AI机器人赢了人类!正反手灵活转换,擦网球高球都能接,专业教练:达到中级选手水平

巴黎奥运会乒乓球团体赛如火如荼,谷歌机器人申请出战——首个达到人类竞技水平的机器人Agent发布!你看一个没留神,就赢了专业教练一个球!正反手快速转换,连续进攻也是不在话下~面对一些突发战术,比如长球高球擦网球,也能沉稳应对。实际测试中,机器人实时适应不同选手风格,最终赢下了与初学者的所有比赛,同中级玩家对打也有55%的胜率。小小乒乓球,拿下!。

2024-08-09 18:31:39 191

原创 20240809 每日AI必读资讯

Runway Academy的Gen-3 Alpha提供了一种将真人视频与生成的视觉特效结合的创新方法。- 新增模型支持: Flux 模型集成为用户提供了示例工作流和模型下载链接,显著增强了 AI 图像生成能力。- 结合3D高斯溅射技术(3DGS),赋予了ExAvatar更真实和高效的渲染能力。- 前端技术升级将带来更强大和可维护的代码库,支持新前端功能的快速开发。混合表示法:结合3D高斯和表面网格,确保几何和外观一致性,减少伪影。全身3D驱动:支持身体、手和面部的全面动画,生成多种姿势和表情。

2024-08-08 18:45:51 2041

转载 最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了

每个季度、半年、年终的财报,打工人看了真的是脑阔痛。这就把腾讯一季度财报表现摘要截图扔给元宝,让它帮忙浅做分析:元宝读取了图标中的数据,还在最后还小小总结了一把:总体来看,该公司在2024年3月31日的财务表现显著优于2023年3月31日,各项指标均有不同程度的增长,尤其是毛利、经营盈利和期内盈利的增长幅度较大。

2024-08-08 17:41:16 277

原创 20240808 每日AI必读资讯

提高可靠性:对于需要严格数据格式的应用场景,比如数据库录入、API 响应等,结构化输出可以避免因格式不一致引起的错误,保证数据的可靠性和一致性。- 减少后处理工作:由于输出数据已经是结构化的,用户无需进行额外的数据清洗或格式转换,可以直接使用这些数据进行进一步的处理或存储。- 例如,可以用一句话描述图像中的前景,或者用简单的线条标记出前景区域,模型就能根据这些提示生成更准确的前景图像。- 通过支持结构化输出,GPT-4o 提供了更高的控制和精度,满足了需要严格数据格式的应用场景的需求。

2024-08-07 18:43:31 3381

原创 20240807 每日AI必读资讯

无论是在3D多器官分割任务还是在2D视盘、视杯、脑肿瘤、甲状腺结节和皮肤病变分割任务中,MedSAM-2均取得了优异的表现。- Anki制卡神器:支持从PDF、Word、Xmind、幕布、Markdown、Excel、微信读书、 欧陆词典等材料快速制作Anki卡片,支持制作挖空题、问答题、选择题等题型。- 可以帮助医生自动分割和识别医学图像中的病变区域,如肿瘤、囊肿、病灶等,提高诊断的准确性和效率。- 支持包括英语、中文、德语、法语、意大利语、韩语等多种语言。

2024-08-07 01:12:33 2097

转载 Apple Intelligence智能应用提示词曝光!

你是一个有用的邮件助理,可以帮助从给定的邮件中识别相关问题并提供简短的回复片段。请输出主要问题以及每个问题的一组可能的答案/选项。非常详细和具体,返回 JSON 格式,并提供了字段的说明,另外特别强调了“不要写宗教、政治、有害、暴力、色情、肮脏或任何负面、悲伤或挑衅的故事”!是一个简单的 CoT,先找出邮件中的提问,然后就每个问题给出简单答复,返回 JSON 格式方便程序解析,如果没有提问,就返回空数组。很简洁,用“3句话”和“60个单词”来限定总结的长度不要太长,虽然无法严格遵守,但是应该也还行。

2024-08-07 01:06:28 121

转载 马斯克再发难、OpenAI 高层巨变:两大核心人物离职,总裁休长假到年底

我相信,即使没有我,OpenAI 和我所在的团队也将继续蓬勃发展。相比上一次,这一次的新诉讼是在加利福尼亚州的北区联邦法院提起的,诉讼书篇幅几乎是原诉讼的两倍,内容方面多了指控 OpenAI 从事敲诈勒索活动,并声称马斯克和其他投资者被 OpenAI 的“虚假人道主义使命”诱导投资。要知道,马斯克在 2015 年与他人共同创立了 OpenAI,他在今年 2 月起诉这家公司,指控 OpenAI 放弃了其最初的非营利使命,将部分最先进的 AI 技术留给了私人客户,要求 OpenAI 恢复开源。

2024-08-06 18:54:18 430

原创 20240806 每日AI必读资讯

联合站队除360,包括BAT在内的大厂有百度、字节跳动、腾讯、阿里巴巴、华为,国产大模型“五小虎”, 智谱AI、月之暗面、MiniMax、百川智能、零一万物,还有五家头部垂类厂商,商汤科技、科大讯飞、好未来、幻方量化、面壁智能。- 该国产大模型能在综合能力12项指标的测试中,11项都超过了GPT-4o,综合能力则高出了10个百分点。Gemini 1.5 Flash的输入成本降低约85%,输出成本降低约80%,并引入上下文缓存和批处理API来优化成本和延迟。- 目前在AI助手当中,所有用户都能免费使用。

2024-08-05 18:50:36 2148

转载 英伟达最强AI芯片曝重大设计缺陷,中国特供版意外曝光!

每个计算托盘是2U,包含1个Grace CPU和4个700W的Blackwell GPU,就像MGX GB200A NVL36一样。此外,由于Grace CPU和Blackwell GPU之间没有C2C互连,因此Grace CPU会位于一个完全独立的PCB上,即CPU主板。来自Keybanc Capital Markets的分析师估算,Blackwell芯片将为英伟达数据中心带来,将从2024年的475亿美元,提升到2025年超2000亿美元的收入。值得注意的是,这比H200的显存带宽要少。

2024-08-05 18:44:19 280

原创 20240805 每日AI必读资讯

2、运动结构方法(structure from motion approach):更短的曝光时间导致数据点少得多,然后移动扫描仪并收集更多数据来逐渐构建并生成出完整的3D图像。- FLUX.1 [dev]:开源版本,相较于标准模型,具备更高的效率。- Perceptive:让人工智能控制的自主机器人,首次对人类患者进行了全过程的牙科手术,速度大约是人类牙医的8倍。机器狗名叫MAX,重量为14kg,每条腿上有3个行动器,可提供平均22N·m的持续扭矩,最大能达到30N·m。,训练数据来自一只拉布拉多犬。

2024-08-05 02:52:58 1463

转载 世界首例!AI机器人做牙科手术,8倍速诊疗比人类医生更精准

如果有人向你推销机器人牙医,是挥挥手根本不信,还是会立刻有种冰冷高速钻头直戳牙龈的恐怖感?波士顿公司Perceptive很快就让你心服口服,让人工智能控制的自主机器人,首次对人类患者进行了全过程的牙科手术,速度大约是人类牙医的8倍。值得注意的是,Perceptive声称,「即使患者频频移动头部,该机器也能安全处理,并且对移动患者的试运行测试均取得了成功。Perceptive宣布了两项新技术,希望机器人诊疗在未来能够为每个人带来更好的牙科体验。

2024-08-05 02:47:00 360

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除