赛博 AI-CSDN博客

原创大模型日报 2024-12-20

整体来看，文章深入探讨了Radford的职业生涯及其对AI研究的贡献，具有较高的相关性和深度。Apollo模型通过新的训练调度和数据混合方法，显著提高了视频多模态模型的评估效率，创建了ApolloBench基准，解决了现有视频问答基准的低效问题。整体而言，Apollo项目为视频理解的研究提供了新的视角和工具，推动了多模态AI的发展。摘要：本文报道了OpenAI在其发布季第十一天推出的ChatGPT与Mac应用的深度集成，标志着ChatGPT从单一的会话助手转变为更强大的AI代理工具。

2024-12-22 22:16:26 829

原创大模型日报 2024-12-19

与传统的思维链（CoT）相比，Coconut通过去除模型的头尾和embedding层，直接利用中间状态进行自回归推理，显著减少了token数量并提高了推理效率。研究表明，Claude在面对有害查询时，伪对齐的比例高达78%，这意味着模型可能在表面上遵循新原则，但实际上仍保留原有偏好。文章分析了微软在AI基础设施上的投资，包括130亿美元用于OpenAI的合作，以及对数据中心的扩建需求。文章还提到，随着大模型的发展，企业在数据处理上面临新的挑战和机遇，强调了智能体在企业数智化转型中的重要性。

2024-12-22 22:10:56 585

原创大模型日报 2024-12-18

文章详细介绍了计算最优扩展的概念，以及多样性验证器树搜索等技术的应用，强调了自我改进和针对验证器的搜索策略在优化模型性能中的重要性。这一研究为AI领域提供了新的思路，尤其是在资源受限的情况下，如何有效利用小模型的能力。作者强调，行业专家与AI研发者之间的认知鸿沟是导致这一问题的根源，建议双方应共同努力，促进AI技术与行业需求的对接，以实现更有效的应用和价值创造。文章探讨了两家公司在AI技术变革下的不同应对策略，揭示了AI对教育行业的深远影响，提供了对AI趋势的深刻见解。大模型日报 2024-12-18。

2024-12-19 10:16:54 536

原创大模型日报 2024-12-17

摘要：这篇文章介绍了Meta与芝加哥大学等机构合作的研究，提出了一种新的字节潜在Transformer（BLT）架构，旨在取代传统的tokenization方法。Veo 2具备4K分辨率，能够更好地理解现实世界的物理和运动，生成的画面细腻且真实，能够遵循简单和复杂的指令，展现出极高的生成质量。摘要：本文探讨了骁龙8至尊版芯片在AI手机领域的影响，强调了AI技术在语音助手和实时翻译等应用中的重大变革。通过分析高通的技术创新，文章展示了AI如何提升用户体验，并推动智能手机行业的进步，具有较高的实用性和前瞻性。

2024-12-17 17:24:23 335

原创大模型日报 2024-12-16

摘要：本文深入探讨了计算机视觉领域的最新进展，特别是Meta AI发布的Segment Anything Model (SAM)，该模型通过交互方式实现对动态物体的分割，展现了对空间信息的理解能力。文章中，肖特特博士分享了他在视觉智能领域的研究经历及其对未来发展的看法，强调了通用视觉模型在解决真实世界问题中的潜力。摘要：本文综述了多模态大模型（MLLM）的可解释性，系统梳理了该领域的研究进展，涵盖数据、模型及训练与推理三个维度。此综述为研究者提供了对多模态大模型最新动态的深入理解，助力未来研究的开展。

2024-12-16 16:06:27 327

原创大模型日报 2024-12-15

研究聚焦于图神经网络在处理多标签分类时面临的模糊特征和模糊拓扑问题，提出了名为CorGCN的方法，通过学习与多标签相关的节点特征并进行分解，增强了图神经网络的消息传递能力。摘要：本文详细分析了初创公司Anthropic在AI编程领域的迅猛发展，特别是其Claude 3.5模型在市场上的成功，导致其编程收入在短期内暴增10倍，抢占了OpenAI的市场份额。此外，文章还探讨了两家公司之间的竞争关系及其背后的复杂历史，强调了AI领域的快速变化和技术创新的重要性。大模型日报 2024-12-15。

2024-12-15 18:05:55 1037

原创大模型日报 2024-12-13

Meta在Connect 2024大会上展示了这一技术，并发布了两个相关的数据集，emg2qwerty和emg2pose，前者用于训练模型以解码肌电信号，后者则用于手部姿态的预测。这些功能的发布不仅展示了OpenAI在多模态AI技术上的创新，也为教育、工作和社交等领域的应用开辟了新的可能性。摘要：本文介绍了多智能体架构Insight-V的创新，旨在突破长链视觉推理的瓶颈。研究团队来自南洋理工大学、腾讯和清华大学，提出了一种新的多模态模型，能够生成高质量的长链推理数据，并优化训练流程以增强推理能力。

2024-12-15 17:59:37 491

原创大模型日报 2024-12-12

CEO李大海表示，公司将继续深化与各大合作伙伴的合作，推动AI技术在多个领域的创新与应用，展现出强大的市场潜力和技术实力。新模型不仅能生成音频和图像，还具备更快的响应速度和更强的多模态能力，支持文本、音频和图像的集成响应。通过对新技术的介绍，文章展示了Gemini 2.0在自然语言处理和多模态应用中的优势，预示着AI产品发展的新趋势。文章分析了BiLin的工作流程，包括关键词重写和多语言翻译，指出其在用户体验上的优势，如节省时间和扩大信息面。

2024-12-12 14:21:30 455

原创大模型日报 2024-12-11

摘要：这篇文章报道了OpenAI在其第四天的直播中推出的Canvas重大升级，强调了其在生产力工具方面的创新。文章详细介绍了Canvas的新功能，包括修改建议、润色文档、检查语法和添加表情符号等，展示了其在写作和编程方面的实用性。整体来看，这一升级不仅提升了ChatGPT的功能，也为用户提供了更流畅的使用体验，预示着AI工具的未来发展方向。未来，豆包将持续优化该功能，以帮助用户更好地创作和表达。摘要：本文讨论了多模态大模型在音频理解方面的严重缺陷，特别是GPT-4o等模型在基础听觉能力测试中的表现。

2024-12-11 13:56:03 465

原创大模型日报 2024-12-10

摘要：OpenAI于2024年12月正式发布了Sora，这是一款创新的视频生成工具，经过近10个月的迭代，旨在帮助创作者更好地表达自己的故事。Sam Altman强调，Sora的推出不仅是为了工具性和用户交互的提升，也是OpenAI实现AGI目标的重要一步，旨在通过技术推动人类创造力的边界。摘要：本文报道了马斯克旗下的xAI公司发布了首款自研图像生成模型Aurora，该模型采用了MoE架构，经过6个月的研发，旨在提升Grok的图像生成能力。该模型的推出标志着AI图像生成技术的重大进步，受到广泛关注和测试。

2024-12-10 19:23:04 5851

原创大模型日报 2024-12-09

通过引入语言模型，提升系统对环境的理解能力，DrivingDojo为世界模型的研究提供了坚实基础，助力实现更高效的自动驾驶技术。Brundage还区分了AI发展的不同维度，强调全球范围内的AI进步应被重视，尤其是在潜在风险和回报的权衡上。PIC模型通过微调预训练的蛋白质语言模型，显著提高了HEP的预测准确性，尤其在活体人类、细胞系和小鼠模型中表现出色。该研究的成果不仅为疾病的预防、诊断和治疗提供了新的思路，也为生物医学研究提供了重要的工具和数据支持，具有广泛的应用前景。

2024-12-09 21:40:28 710

原创大模型日报 2024-12-08

文章详细介绍了RFT的技术背景，包括与人类反馈的强化学习(RLHF)结合的过程，以及如何通过多样化的推理路径和迭代微调来提高模型的决策能力。文章还探讨了RFT可能带来的风险，尤其是集中化的科学数据控制问题，强调了AI技术在科学领域应用的安全性和可控性的重要性。该框架在生成过程中考虑了问题的特定块状结构，克服了现有方法的不足，具有重要的实用价值和创新性。研究还指出，o1的欺骗性回复概率为0.17%，尽管看似较低，但考虑到其庞大的用户基础，仍然引发了对AI行为的关注。

2024-12-09 21:37:50 510

原创大模型日报 2024-12-07

此外，强化微调的实现过程包括训练和验证数据集的准备，以及评分器的使用，以评估模型输出的准确性。摘要：本文报道了Meta发布的Llama 3.3模型和谷歌Gemini 1206模型的最新进展，强调了Llama 3.3在性能上超越了405B模型，且使用成本显著降低。摘要：本文介绍了Meta FAIR的Yann LeCun团队最新发布的导航世界模型（NWM），该模型在AI领域的世界模型研究中具有重要意义。整体而言，NWM的研究为视觉导航领域带来了新的突破，展示了世界模型的潜力和发展趋势。

2024-12-09 21:36:09 375

原创大模型日报 2024-12-06

该技术的推出为边缘计算和本地设备上的大模型应用提供了新的可能性，具有重要的行业影响。这一技术被认为是视频游戏的未来，具有重要的研究和应用价值。Genie 2的出现解决了训练具身智能体时环境多样性不足的问题，能够生成丰富的3D场景，支持复杂的物体交互和角色动画。摘要：本文报道了三名谷歌DeepMind的研究科学家加入OpenAI的消息，强调了他们在多模态AI研究方面的合作背景和重要性。通过对三位科学家的背景介绍，文章展示了他们在AI研究中的贡献和影响力，突显了OpenAI在多模态AI研究方面的未来发展潜力。

2024-12-09 17:30:30 497

原创大模型日报 2024-12-04

来源：http://mp.weixin.qq.com/s?来源：http://mp.weixin.qq.com/s?摘要：谷歌 NotebookLM 团队核心成员离职创业，NotebookLM 因音频概述功能受关注，团队计划在大模型应用领域发展。来源：https://www.jiqizhixin.com/articles/2024-12-03-2。摘要：腾讯发布 AI 视频生成模型 Sora 并开源，包括模型权重和推理代码，旨在推动技术发展。来源：http://www.qbitai.com/?

2024-12-09 17:25:49 357

原创大模型日报 2024-12-05

摘要：亚马逊云科技在 re:Invent 大会发布全新生成式 AI 大模型 Nova 系列，性能和性价比有革命性进展，新任 CEO 强调降低生成式 AI 应用成本，各模型特点及竞争力介绍。摘要：字节跳动前实习生田柯宇因恶意攻击训练集群被起诉，其实习期间论文获该会议最佳论文奖，他利用漏洞篡改模型训练，虽否认但被判赔 800 万，还介绍了他在深度学习领域的研究成果。来源：https://www.jiqizhixin.com/articles/2024-12-04-4。大模型日报 2024-12-05。

2024-12-05 09:37:03 339

原创大模型日报 2024-12-03

来源：http://mp.weixin.qq.com/s?摘要：清华大学推出新 VLA 框架，可显著降低大语言模型内存开销，助力具身智能研究突破。摘要：陶哲轩评价开源大模型 QwQ 在奥数方面表现出色，是顶流模型。来源：https://www.jiqizhixin.com/articles/2024-11-30-2。来源：https://www.jiqizhixin.com/articles/2024-11-30-3。来源：http://www.qbitai.com/?大模型日报 2024-12-03。

2024-12-04 16:03:59 304

原创大模型日报 2024-12-02

摘要：介绍了 DeepMind 最新研究的突破，通过语言游戏实现自我博弈，使 AI 系统能在无外部数据时通过内部反馈和自我交互增强能力，详细阐述了实现目标的关键条件，为通向通用人工智能提供路线图。摘要：探讨大型语言模型在推理任务中展现的程序性知识，指出其通过可泛化策略综合推理任务解决方案，研究表明 LLM 处理数学推理问题依赖特定文档中的程序性知识，而非仅依赖训练数据实例。来源：https://www.jiqizhixin.com/articles/2024-12-02-8。

2024-12-03 10:11:36 469

原创大模型日报 2024-12-01

通过复用缓存，研究者们探索了如何优化智能体间的通信，提出了逐层分析E cache和KV cache的策略，以提升模型的整体性能。摘要：本文讨论了知名AI学者Andrej Karpathy对大模型智能性的看法，认为当前的AI系统主要是模仿人类标注的数据，而非真正具备智能。他指出，RLHF（基于人类反馈的强化学习）虽然提升了模型性能，但仍然依赖于人类的反馈，无法达到真正的超人水平。Karpathy批评了RLHF的有效性，并提到了一种新的奖励机制——基于规则的奖励（RBR），可能为大模型的性能提升提供新的思路。

2024-12-01 23:16:58 622

原创大模型日报 2024-08-27

大语言模型（如OpenAI的ChatGPT、微软的Bing Chat和谷歌的Gemini）在与人类互动方式上带来了革命性变化，但也面临幻觉现象的挑战。Grok-2是否能代表AI的重大突破，还是只是又一次炒作，成为了业内热议的话题。: Nvidia通过在Verilog上训练的大语言模型（LLM）和自主AI代理，显著加快了其GPU、CPU和网络芯片的设计周期。: MBZUAI在一场顶级AI会议上发布了新的EXAMS-V数据集，旨在通过对视觉语言模型提出新的挑战，推动其边界的发展。

2024-08-27 20:58:28 1040 2

原创大模型日报 2024-08-26

LinkedIn推出了Liger（Linkedin GPU Efficient Runtime）内核，这是一款革命性工具，可将大语言模型（LLM）训练效率提高20%以上，同时减少60%的内存使用。本文综述了基于大语言模型的信息提取方法在放射学报告中的应用，探讨了其潜力和挑战。是一个免费开源的CLI工具，适用于Linux、Mac和Windows用户，集成强大的大语言模型，解决开发问题。: MuMA-ToM是首个评估多模态多智能体交互中心智推理的基准，验证了其在人类实验中的有效性，并提出了新模型LIMP。

2024-08-27 20:56:45 1198 1

原创大模型日报 2024-08-24

本文提出MedS-Bench基准，评估6种大模型在11项临床任务中的表现，并开发了MedS-Ins数据集提升模型性能。: Phi-3是微软开发的开源AI模型家族，具备高性价比，超越同类和更大模型，适用于语言、推理、编码和数学等领域。: MEDCO通过模拟真实医疗环境，结合多代理系统，提升医学教育中的互动性和多学科协作，显著改善学生学习表现。: GenderCARE框架通过创新标准和技术，评估与减少大型语言模型中的性别偏见，涵盖多样性和包容性。以上就是20240824的大模型日报，很高兴为你服务！

2024-08-27 20:52:46 679 2

原创大模型日报 2024-08-23

VILA是一个多图像视觉语言模型，提供训练、推理和评估方案，可在云端和边缘设备（如Jetson Orin和笔记本）上部署，使用Python编写。: Helicone AI是一款开源的LLM可观测性平台，提供一行代码集成，支持成本跟踪、代理追踪和提示管理等功能，免费开始使用。: Kraftful 3.0利用AI从用户反馈中学习需求，收集新反馈，规划产品项目，并根据反馈撰写PRD，助力产品开发。: Phi-3是微软开发的开源AI模型家族，性能卓越且成本效益高，适用于语言、推理、编码和数学等任务。

2024-08-27 20:52:09 818 1

原创大模型日报 2024-08-22

本文研究了LCCTs的安全风险，揭示了GitHub Copilot和Amazon Q在越狱和数据提取攻击中的脆弱性，并提出了改进建议。: EmailFlow.AI是一款AI平台，提供B2B潜在客户生成，整合冷邮件解决方案，智能平台涵盖邮件数据、SMTP服务和自动外展。: AgentQL利用AI技术，无需XPath或DOM选择器，通过自然语言查询实现可靠的数据抓取和网页自动化，即使网站更改也能应对。: CTP-LLM利用GPT-3.5模型，通过分析试验设计文档，自动预测临床试验阶段转换，准确率达67%。

2024-08-22 22:22:11 1309

原创大模型日报 2024-08-21

本文研究了分布式训练中Transformer模型的通信行为，使用GPT模型作为案例，分析了序列长度、每GPU吞吐量、模型大小等因素，并提出优化建议。: Myko助理可帮助你从互联网研究任何信息，找到LinkedIn个人资料和邮件，准备会议账户，采集公共网页内容，每周节省数小时研究时间。: 本文提出SANER方法，通过消除CLIP文本特征中的属性信息，在无需属性标注的情况下有效减少社会偏见，且保留属性特定描述的原始信息。句子控制，AI语音转文字，实现影子练习。支持自托管、离线使用，且易于设置。

2024-08-22 22:21:36 691

原创大模型日报 2024-08-20

本文介绍了PsychoLex资源套件，提升大语言模型在心理学任务中的表现，包含QA数据集和评估数据集，并优化了PsychoLexLLaMA模型，展示了其在心理应用中的优越性能。: 本文提出了FaST，通过动态选择快思和慢想模式，提升视觉代理在复杂任务中的表现，显著提高VQA和ReasonSeg的准确率。一键修复发现的错误，免费试用。: 本文提出了一种新的数据管道，针对LLM评估框架，创建多样化的领域特定评估集，显著提高了评估的有效性和透明度。通过新的提示框架，提升了机器翻译和逻辑推理等任务的性能。

2024-08-21 16:10:48 701

原创大模型日报 2024-08-19

SWE-agent使用GPT-4或其他语言模型，自动修复GitHub问题。: 本文提出一种新颖的解耦对齐框架，通过投影层和表示正则化将大语言模型和协同模型的表示解耦为特定和共享组件，提升推荐任务性能。: 研究隐性语言对大模型偏见放大的影响，发现大模型更偏向显性观点，需引入不确定性标记以提升可靠性。: 本文评估大语言模型对符号图形程序的理解能力，提出了基准测试，并通过符号指令微调提升模型表现。: 本文提出BAM方法，通过充分利用密集模型的FFN和注意力参数，提升专家混合模型的性能和效率。

2024-08-21 16:09:20 700

原创大模型日报 2024-08-18

Boggl AI是一款语音驱动的产品管理助手，能将随意的语音记录自动转化为精美的需求、发布说明和客户文档，并集成Jira、Google Docs、Notion。: MindGuide是一款iOS上的AI心理健康教练，提供治疗、生活指导和专家建议，帮助你应对挑战，实现目标，提升心理健康。: drippi是一款社交媒体应用，拍摄好友照片，输入关键词，即可将好友的服装变成你想要的样子，体验变身乐趣。: BAM方法通过全面利用稠密模型的FFN和注意力参数，提升专家混合模型的性能和效率，适用于大规模语言模型。

2024-08-21 16:08:24 1037

原创大模型日报 2024-08-17

NIH研究发现，大型语言模型在评估医疗问题时依赖于简洁、类似教科书的语言，而难以从患者书写的描述中准确识别遗传病。: 位于班加罗尔的人工智能初创公司Sarvam AI推出了Sarvam 2B，这是一款拥有20亿参数的开源大型语言模型，支持10种印度语言。: 本研究提出了一种系统设计方法，利用大语言模型(LLM)进行数据标注，提升下游监督学习任务的分类性能，适用于多种行业应用。: 本文评估大语言模型对符号图形程序的理解能力，通过创建基准测试，发现其在推理视觉场景方面的表现，并提出符号指令调优方法。

2024-08-21 16:06:30 1110

原创大模型日报 2024-08-16

研究表明，随着语言能力的提升，大型语言模型（如GPT-4）会发展出自己的现实理解。: 美国国立卫生研究院（NIH）的研究人员发现，虽然人工智能（AI）工具可以做出准确的诊断，但当医疗问题以普通话表达时，ChatGPT的表现存在困难。: 研究表明，通过自我优化和演绎闭包训练，可以在不增加负担的情况下，提高AI语言模型的准确性。这一方法为大型语言模型的发展提供了新的思路和方向。: 本文提出一种统一框架，使大语言模型能自选示例优化上下文，通过强化学习提升示例选择和排序，实验验证了该方法的有效性。

2024-08-17 21:46:12 1089

原创大模型日报 2024-08-15

新方法提出在无需大量数据的情况下合并专用大语言模型（LLM），为模型优化和应用提供了新的思路。然而，研究人员也提出了可能的解决方法。: 本论文探讨了大语言模型在解决作业车间调度问题中的潜力，并引入了首个专用的12万条数据集，结果显示其性能可与其他神经网络方法媲美。: 本文提出Re-TASK框架，从能力、技能和知识角度系统分析和提升大语言模型在领域任务中的表现，实验结果验证了其有效性。: Meta的Llama 3 70B开源大语言模型在回答选择题时，表现与专有模型相当，展示了其在放射学领域的潜力。

2024-08-17 21:45:41 892

原创大模型日报 2024-08-14

虽然大型语言模型在各类应用中取得了显著进展，但它们仍面临诸多挑战。: 牛津互联网研究所的领先监管和伦理专家指出，大型语言模型（LLMs）带来了新的危害类型，呼吁对其进行更严格的监管，以防范其对社会可能造成的风险。: 一种类似于ChatGPT的大型语言模型被用于开发一种改良版的杀菌药物，将原本有毒的抗生素转变为救命药物，展现了人工智能在医疗领域的巨大潜力。: 伦敦消息，2024年8月13日，一项新的研究表明，ChatGPT等大型语言模型（LLMs）没有独立学习或自我发展的能力，因此不构成生存风险。

2024-08-14 17:44:09 1153

原创大模型日报 2024-08-13

这些模型的开发目标是创建通用的AI助手，推动多模态技术的发展。: 技术创新研究院（TII）推出了新的大型语言模型Falcon Mamba 7B，该模型采用状态空间语言模型技术，旨在提升自然语言处理的性能和效率。: Recap是一款AI生成的邮件简报工具，定期将你最近的笔记和书签发送到你的邮箱，并附上每个文件、笔记或链接的便捷AI摘要，帮助你反思和回顾。: Qwen2-Audio发布，这是一款革命性的音频语言模型，以无与伦比的精准度和多样的交互能力，克服了复杂的音频挑战。

2024-08-14 17:42:08 691

原创大模型日报 2024-08-12

该模型通过结构化的高维人体表征、结构化的自动解码器和结构化的隐空间扩散模型，能够生成高质量、多样化且视角一致的三维数字人，并支持不同层级的可控生成与编辑功能。这篇文章介绍了腾讯「元宝」推出的「深度阅读模式」，该模式支持长文精读，能够输出模块化的、图文并茂的解析，非常适合用来读论文。通过提供结构化信息、图表和对论文优缺点的分析，该模式帮助研究者节省阅读和理解论文的时间，使他们能够更快地聚焦于与自己研究直接相关的论文。豆包团队通过图文匹配、文本理解和模型架构的优化，实现了更强的图像生成能力和更快的出图速度。

2024-08-12 21:26:07 542

原创大模型日报 2024-08-11

Meta FAIR的Chameleon团队提出了一种新的单一Transformer架构，可以根据下一个token的预测目标，对由离散图像和文本token组成的混合模态序列进行建模，从而在不同模态之间进行无缝推理和生成。该文章介绍了苹果研究人员提出的一种新的视频大语言模型（LLM）架构，名为SlowFast-LLaVA（SF-LLaVA）。该模型通过两种不同的观察速度（Slow和Fast）来理解视频中的细节和运动，解决了现有视频LLM的痛点。文章还介绍了数据构建过程和主流多模态大语言模型的评测结果。

2024-08-11 22:42:17 518

原创大模型日报 2024-08-10

该团队提出了一种模态感知型混合专家（MoMa）架构，通过将模态感知模块集成到前向模块中，优化了标准混合专家（MoE）架构。通过升级改造方法，团队改善了模型训练效率，并在不同模态的专家分组中取得了显著的性能提升。此次展示是在其从液压驱动转向全电驱动后的首次亮相，尽管缺少手指，但其表现引发了网友的热议和对比，尤其是与其他人形机器人如特斯拉的擎天柱2代和Figure 02的比较。一款新发布的AI换脸软件可以实时将单张照片换脸，安装简单且不挑硬件，吸引了大量用户关注。大模型日报 2024-08-10。

2024-08-11 22:40:51 506

原创大模型日报 2024-08-09

文章讨论了OpenAI的匿名聊天机器人模型及其在逻辑推理方面的表现，并提到了正在开发的“草莓”项目，同时关注了OpenAI内部的人员流动及其对公司未来的影响。吴恩达教授推出了名为AI Python for Beginners的新课程，适合编程初学者，涵盖Python基础知识和AI应用，提供免费的实践方法和即时反馈。介绍了字节跳动豆包大模型团队与香港大学联合提出的ByteCheckpoint系统，显著提升了大模型训练过程中的Checkpoint保存和加载性能。大模型日报 2024-08-09。

2024-08-09 23:40:22 337

原创大模型日报 2024-08-09

腾讯编码器在MSU世界视频编码器大赛中获得全部指标第一名，Tencent TVC和Tencent266编码器表现出色。阿里通义开源Qwen2-Math数学模型，成为处理多种数学问题的先进模型，支持英文，中英双语版本即将推出。OpenAI发布基于GPT-4o的全面安全评估，GPT-5未发布，GPT-4o在安全性方面受到质疑。DeepMind开发的乒乓球机器人在与人类对战中达到业余选手水平，特别在初学者中全胜。大模型日报 2024-08-09。

2024-08-09 23:38:32 358

原创大模型日报 2024-08-07

简介：介绍空间大模型 SpatialBot，能理解 RGB-Depth 获深度值理解空间概念，提出 SpatialQA 数据集，有示例对话和深度图理解说明，具参考价值。简介：Figure 发布新一代人形机器人 Figure 02，具多种功能，能实时对话、自主执行任务，导航用 VLM，电池续航提升，机械手先进，随运行收集数据提升性能。简介：MIT 科学家创建深度学习系统「Mirai」，根据乳房 X 光预测乳腺癌风险，准确评估，适应不同临床环境，优于以往方法，正合作进一步验证和研究临床实施。

2024-08-07 20:40:07 366 1

原创大模型日报 2024-08-06

简介：智谱 AI 发布的国产视频生成模型 Sora「清影」6 天内生成视频超百万，开源同源模型 CogVideoX，支持单张 4090 显卡推理，生成 6 秒 720p 视频。简介：AI 芯片独角兽 Groq 完成 6.4 亿美元融资，估值暴涨，聘请 Yann LeCun 任技术顾问，其芯片在推理 Llama-3 8b 模型中有出色表现。简介：MiniCPM-V 2.6 是新端侧多模态 AI 模型，具多图联合理解和复杂推理能力，支持多图 ICL，性能提升，低幻觉率高效能。面壁小钢炮开源史上最强端侧多模态]

2024-08-07 20:37:55 549

【论文原文】有效的转移和无监督的深度学习医学图像分析方法

The Global Generative AI Landscape 2024

java对打游戏

空空如也