AI潮汐日报1217期：Gemini 2.0 成“P 图神器”，一句话P图、NeurIPS 2024神仙打架，太热闹、AI摄像头识别酒驾行为-CSDN博客

本文链接：https://blog.csdn.net/qq_32036091/article/details/144521653

AI 潮汐日报，旨在提供最新潮、最核心、最有意思的AI速递。四大专栏：今日热点、应用速递、研究进展、思维碰撞。

今日热点

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

谷歌Gemini 2.0以其“说话就能一键P图”的功能受到关注。用户只需输入文字指令，Gemini 2.0即可结合图片内容完成P图，如将车改装成敞篷车、改变车身颜色并添加海滩用品等。该技术保持了图片元素的一致性，并支持同时修改图片中的多个元素，甚至将一个物件变成另一个。Gemini 2.0还能结合不同图片进行P图，展现出丰富的想象力和创造力。据悉，Gemini 2.0将于明年年初更广泛地推出，目前内测玩家的体验已引起广泛关注。

NeurIPS 2024神仙打架，太热闹

OpenAI支持新维度的Scaling Law，预训练未终结

在NeurIPS 2024会议上，OpenAI核心成员Noam Brown提出，尽管预训练可能终结，但Scaling Law并未死亡，而是进入了以推理计算为代表的新阶段。Brown强调，从GPT-2到GPT-4的进步源于数据和算力规模的扩大，而推理成本在过去的扩展中被低估。他提出，增加模型的推理时间可以显著提升效果，类似于大幅扩展模型规模。这一观点引发了关于AI未来发展方向的讨论，表明大模型的发展方向可能正从纯粹的预训练转向更注重推理能力的扩展。

AI预训练未来趋势引发讨论

Ilya在NeurIPS 2024中提出预训练结束的观点，引发广泛讨论。谷歌的Logan Kilpatrick和LeCun等AI领袖反驳称预训练未结束，数据资源尚未耗尽。Epoch AI报告指出，尽管当前SOTA模型参数减少，下一代模型规模可能再次增大。目前，AI需求激增导致模型“瘦身”，同时蒸馏技术和Scaling Law转变促使模型变小。尽管合成数据和计算进步可能支持更大模型，但短期内模型规模是否会超过GPT-4仍是未知。

MIT教授NeurIPS发表歧视言论后道歉

在NeurIPS会议上，MIT教授Rosalind Picard在演讲中展示的PPT包含对中国学生的歧视性言论，引发众怒。一位中国女学生在QA环节中直接质疑其言论，要求对种族歧视作出回应。AI界人士，包括谷歌首席科学家Jeff Dean等，纷纷发声谴责。NeurIPS组委会发布官方道歉声明，承认言论强化了隐性偏见，违反了会议规定。在舆论压力下，Picard教授随后在MIT媒体实验室发表道歉信，表示后悔提及国籍细节，并对造成的负面联想道歉。该事件凸显了学术界对种族歧视问题的敏感性和对平等尊重的重视。

英国测试AI摄像头识别酒驾行为

英国交通管理部门正在德文郡和康沃尔郡测试名为Heads-Up的AI摄像头，用以识别可能的酒驾或毒驾行为。该设备通过监测道路使用和驾驶行为，判断驾驶员是否存在酒驾或毒驾嫌疑，并通知警方设点拦截。这种设备可随时部署，且驾驶者通常无法察觉监控。开发公司Acusensus希望该技术能减少因酒驾导致的致命事故。

应用速递

Anthropic的Claude 3.5在编程领域超越OpenAI

AI初创公司Anthropic开发的Claude 3.5在编程辅助领域取得显著成绩，其性能在某些方面已超过OpenAI的模型。Anthropic的年化收入在软件开发和代码生成业务上实现了10倍增长。Cursor将其AI编程助手的默认模型从GPT更换为Claude，显示了Anthropic在AI编程领域的竞争力。尽管OpenAI在营收和规模上仍保持优势，Anthropic的增长势头和技术进步使其成为值得关注的竞争对手。

OpenAI Sora开放，革新视频制作行业

OpenAI正式向用户开放人工智能视频生成模型Sora，用户可以通过文字、图像或其他视频素材生成长达20秒的视频。Sora具备强大的视频编辑功能，包括重混、重新剪辑等，显著提升视频制作的效率和成本效益。Sora的一致性控制技术领先业界，对国产视频生成模型构成压力。Sora的上线预示着AIGC技术在影视行业的全面“入侵”，可能将大幅降低制作成本，推动媒体行业的新一轮“工业革命”。

研究进展

DeepMind发布视频分层新模型，实现物体与背景完美分离

DeepMind的研究人员开发了一种新视频分层方法，能够在无需假设背景静止或精确相机姿态的情况下，将视频分解成多个包含物体及其效果（如阴影和反射）的层，实现物体与背景的完美分离。这一技术提升了视频编辑的灵活性和效率，能够对被遮挡的动态区域进行补全，对于视频编辑和后期制作具有重要意义。

思维碰撞

周鸿祎谈AI时代企业发展：从“原子弹”到“茶叶蛋”

360集团创始人周鸿祎在中国企业领袖年会上分享了对AI的最新思考。他提出，大模型应从全能转向专业化垂直化发展，成为企业智能体。他强调，AI与企业业务的结合应由一线员工决定，推动企业全员学习AI。周鸿祎建议，企业应从办公和营销场景开始AI化，选择业务场景打造专业大模型，积小胜为大胜。他认为，AI安全同样重要，需用大模型解决新型AI安全问题，护航企业发展。

微软CEO纳德拉：OpenAI在AI领域领先两年

微软CEO萨提亚·纳德拉近日表示，OpenAI在人工智能领域拥有约两年的领先优势，几乎“没有竞争对手”。自2019年微软向OpenAI投资10亿美元起，双方合作加深，微软将OpenAI技术整合到多个产品中。纳德拉认为，ChatGPT的发布为OpenAI提供了“逃逸速度”，使竞争对手措手不及。微软已向OpenAI投资总计130亿美元，并为其提供云计算资源，巩固了OpenAI在AI领域的领先地位。