Cyber Weekly #29

最新推荐文章于 2025-05-16 14:05:46 发布

老A的AI实验室

最新推荐文章于 2025-05-16 14:05:46 发布

阅读量864

点赞数 19

分类专栏：赛博周刊文章标签：人工智能 AI GenAI LLM 机器学习

本文链接：https://blog.csdn.net/acelit/article/details/143099423

版权

赛博周刊专栏收录该内容

59 篇文章

订阅专栏

赛博·新闻

1、英伟达开源最新大模型Nemotron 70B

英伟达开源了其最新的大模型Llama-3.1-Nemotron-70B-Instruct，该模型在性能上超越了OpenAI的GPT-4o和其他开源模型，目前市场上只有OpenAI的o1模型能与之竞争。Llama-3.1-Nemotron-70B-Instruct基于Llama-3.1-70B构建，其性能在多个基准测试中均排名第一。英伟达还开源了用于训练该模型的数据集HelpSteer2，以及另一个模型Llama-3.1-Nemotron-70B-Reward，用于预测LLM生成的响应的质量。尽管该模型在通用领域表现出色，但在数学等专业领域尚未调优。部署此模型需要至少4个40GB或2个80GB的NVIDIAGPU以及150GB的可用磁盘空间。

2、零一万物Yi-Lightning模型超越GPT-4o

在对大模型的测评中，LMSYSOrg发布的Chatbot Arena，以「盲测」机制著称，是最能反映用户体验的测评标准之一。本周零一万物发布了全新SOTA旗舰模型Yi-Lightning亮相，中国大模型中首度超越GPT-4o，该模型排名世界第六，中国第一，稳居世界第一梯队大模型公司之列。其中，在中文子榜单上，Yi-Lightning超越了xAI发布的Grok-2-08-13、智谱发布的GLM-4-Plus等国内外优质模型，与o1-mini等模型并列排名世界第二。

3、Mistral AI推出端侧模型Ministral 3B和8B

Mistral AI于2024年10月17日宣布推出两款新的端侧模型，Ministral 3B和Ministral 8B，这些模型专为端侧计算和边缘用例设计，旨在提供高效的本地、隐私优先的推理解决方案。据介绍，这些模型在知识、常识、推理、函数调用和效率方面达到了新的高度，支持高达128k的上下文长度，并具有特殊的交错滑动窗口注意力机制（SWA），以提高推理速度和内存效率。这些模型可以直接使用或微调，以适应从协调智能体工作流到创建专业任务工作者的各种用途。MistralAI展示了这些模型在多个任务中的性能，始终优于同类产品。此外，这些模型还可以与大型语言模型结合使用，作为多步骤智能体工作流中函数调用的高效中介。

4、Adobe推出AI视频神器，支持一句话P视频

在今年的Adobe Max大会上，Adobe正式推出了自己的AI视频模型——Firefly Video Model，进军生成式人工智能领域。概括来讲，这个模型包含三个有趣且实用的功能：

Generative Extend（生成拓展）
Text-to-Video（文生视频）
Image-to-Video（图生视频）

5、Suno推出新功能：让照片和视频秒变专属歌曲

Suno公司推出了一项创新功能Suno Scenes，它允许用户通过其iOS移动应用将个人的照片和视频转换成原创歌曲。这项功能适用于多种场景，如朋友聚会、旅行视频、美食照片等，为创作者提供了新的创作工具和灵感来源。Suno Scenes利用复杂的机器学习算法和音乐理论，分析图像和视频的内容、情绪和氛围，并将这些元素转化为音乐。这不仅简化了音乐创作过程，还引发了关于AI在音乐创作中角色的讨论。Suno Scenes的出现为音乐创作领域注入了新的活力，为普通用户提供了自我表达的新方式，也为专业音乐人提供了新的创作思路。

赛博·洞见

1、关注AI必读！Anthropic CEO万字长文-预测强人工智能的积极未来

Anthropic的CEO Dario Amodei在其长文中详细讨论了强人工智能可能在不久的将来对人类社会产生的积极影响。他预测，AI的发展将显著加速生物学领域的进展，可能在5-10年内实现未来50-100年的科学成就，包括几乎所有自然传染病的预防和治疗、癌症的消除、遗传性疾病的预防和治疗、阿尔茨海默病的预防、以及其他疾病的治疗改善。此外，AI还将推动神经科学的进步，可能在5-10年内合理完成大多数精神疾病的预防和治疗。在经济发展方面，AI有望促进全球经济增长，特别是在发展中国家，通过提高健康水平和生活质量来减少不平等。在治理方面，AI技术可能帮助民主政府赢得信息战，改善法律和司法系统，促进公民之间的共识。最后，AI的发展将引发对工作和人生意义的重新思考，可能需要社会对话和经济模式的重新组织。Dario Amodei强调，尽管预测未来充满挑战，但AI的积极影响是值得关注和期待的。

2、一位风险投资人的真诚辞职信:现在的科技似乎只是在维持现状。

Jerry Neumann在文章中回顾了自己作为风险投资人的职业生涯，分享了他对科技行业现状的看法。他认为，与过去相比，现在的科技似乎只是在维持现状，而非推动进步。Neumann坦诚地讨论了自己作为投资人的策略和决策过程，以及他如何通过理论来指导自己的投资实践。他提到，尽管取得了一定的成功，但他感到现在的初创公司更多是在做生意而非推动进步，这让他失去了继续投资的动力。Neumann还提到，随着年龄的增长，他开始重新考虑自己的生活目标和价值观，希望能找到更有意义的工作来贡献自己的力量。

3、NotebookLM爆火背后：AI原生产品的核心洞察与创新

NotebookLM是Google实验室推出的一款AI原生笔记管理工具，它通过结合多模态模型Gemini 1.5 Pro和音频模型，使用户能够将文本、视频、PPT、录音和数据集转换成有趣的播客形式。产品负责人RaizaMartin分享了NotebookLM的诞生历程、产品设计的核心理念、团队工作方式，以及产品的未来发展方向。她强调了在大型组织中保持创业心态的重要性，寻找独特工具用法的创新思维，以及不等待完美产品发布时间的迭代策略。Raiza还讨论了如何通过“内容工作室”工具，让用户与内容以新的方式互动，并生成出人意料的惊喜内容。访谈中还提到了NotebookLM在教育、职业发展等多个领域的应用潜力，以及团队如何通过用户反馈进行产品迭代。

4、曾鸣：我们正迎来AGI的雅虎时刻

曾鸣教授在演讲中分享了他对AGI商业化前景的思考，提出我们正迎来AGI的“雅虎时刻”，预示着AGI原生应用的爆发和演进。他回顾了过去四十年的技术变革，从个人电脑到PC互联网，再到移动互联网，每一次技术的突破都带来了新的商业机会和原生应用。曾鸣教授认为，AGI的发展也将经历类似的三个阶段：技术发展的早期、技术能够支撑某项重要业务的闭环、给大众市场带来体验的飞跃。他强调，原生应用的爆发需要充分利用新技术的技术优势，创造新颖的用户体验和新的商业模式。曾鸣教授还讨论了ChatGPT的成功和未来发展方向，以及可能出现的比ChatGPT更成功的2C服务。他预测，基于大语言模型的智能程度和应用成本的急剧下降，以及生态的快速垂直分层，我们很可能在未来一两年看到改变我们生活的、AGI领域的第一个原生应用。

5、前谷歌地图团队获得红杉等600万美金，打造人工智能协作板，超越聊天机器人

Cove是一款新型的人工智能协作板，由前谷歌地图团队开发，旨在改变人与AI的交互方式，促进团队协作和思考。Cove的创始团队凭借在谷歌地图的丰富经验，打造了这款产品，目前已正式推向市场。Cove的核心功能包括无限画布、响应卡片、开放混合域、研究助手和Chrome插件，旨在提供非线性的思考方式和强大的研究能力。Cove已获得红杉资本等顶级投资者的600万美金种子轮投资，展现出市场对其潜力的认可。Cove的产品定位是超越聊天机器人，成为新型的AI协作者，通过创新的UI设计，释放大型语言模型的全部功能。

6、10月AI新产品盘点，大家都做的太酷辣！

作者橘子，文章盘点了四款10月份发布的AI新产品，每款产品都以其独特的功能和创新性吸引了公众的注意。这些产品不仅展示了AI技术的多样性，也体现了其在提升用户体验和创造新娱乐形式方面的潜力。

有挂：一个浏览器插件，允许用户通过自然语言对话对网页进行编程，满足个性化需求。
陌生人闹钟：通过AI裁判监督声音，每天早晨由一个陌生人叫醒用户，为生活带来惊喜。
歌词爆改机：使用AI为热门歌曲重新配词并演唱，创造出全新的意境。
EVE：AI3D伴侣，预示着AI陪伴赛道向游戏领域的拓展。

7、Sam Altman最新哈佛大学创业分享：95%创业者选择让AI在特定场景中勉强起作用，可能是个错误

OpenAI的CEO Sam Altman在哈佛大学的一次对话中分享了他对AI未来的看法。他预测AI技术将继续戏剧性地进步，而不是停滞不前，并建议创业者应基于AI技术的长期增长进行投资，而不是仅仅在特定场景中勉强使用AI。Altman还提到，如果能够回到过去，他可能会选择营利性结构来支持AI技术的发展。他强调了OpenAI在技术开发中的安全性和责任感，特别是在决定是否部署重大技术如GPT-5时的慎重考量。此外，Altman分享了他的个人成长经历和对AI技术如何减少社会不平等的看法。他鼓励人们学会使用AI工具，并认为AI应该成为一种平等的力量。

8、AI大爆炸后，寻找Agent的“水和空气”

在AI技术快速发展的背景下，实时互动（Real-time Engagement）变得像水和空气一样无处不在，改变了多个行业赛道。随着大模型技术的发展，AIAgent领域也迎来了寻找自己“水和空气”的变革期。文章介绍了TEN Framework，这是一个开源的Agent框架，可以帮助开发者快速搭建基于RTC技术的多模态Agent，并且兼容OpenAI的Realtime API。TEN Framework提供了模块化可视化界面，支持语音互动、视频理解等核心实时多模态能力，并且提供了丰富的Demo和开源资源，以降低开发门槛。此外，文章还讨论了实时互动技术如何提升人机交互的体验，以及TEN Framework在智能客服等应用场景中的潜力。

9、a16z Demo Day现场直击！32家AI创企齐聚，解读北美游戏三大新趋势

在a16z Games旗下SPEEDRUN加速器的Demo Day活动中，32家AI创业公司展示了他们的创新项目，涵盖了AI+游戏、流媒体、元宇宙等多个领域。这些公司通过结合AI技术，旨在提供全新的游戏体验和互动方式。其中，Sekai、Clout Kitchen、Story Engine等公司尝试将AI与游戏深度结合，推动游戏领域的革新。同时，也有公司如Captain.tv和Crema Social探索流媒体和社交领域的新玩法。此外，活动还涉及了游戏+元宇宙、游戏+医疗健康等交叉领域的创新尝试。这些创业公司不仅展示了AI技术在游戏行业的广泛应用，也体现了连续创业者的深刻认知和丰富经验。尽管许多企业还处于起步阶段，但他们的创新理念和产品预示着游戏行业的未来发展。

10、爆款AI硬件创始人吕骋：融资5000万美元，卖了10万台，窗口期还剩8个月

吕骋在采访中分享了Rabbit公司的发展情况，包括已完成的5000万美元融资和销售超过10万台的R1设备。他讨论了公司的盈利模式，强调硬件销售的利润足以支持用户使用1.5年以上，且不打算采用订阅模式。吕骋还提到了Rabbit的技术策略，包括使用虚拟机而非API来提供服务，以及他们如何通过这种方式绕过应用平台的规则。他提到了与大公司竞争的挑战，尤其是苹果即将推出的“Apple Intelligence”，并认为Rabbit有大约8个月的窗口期来巩固市场地位。吕骋还分享了他对AI行业的未来展望，包括对通用AI代理的期望和对行业商业模式的重新思考。

11、图灵奖得主Yann LeCun万字演讲：今天的AI比猫还笨，自曝早已放弃大模型

在最近一次公开演讲中，Yann LeCun分享了他对当前AI技术水平和未来发展方向的深刻见解。他指出，尽管AI取得了显著进步，但目前的AI系统在理解世界和常识方面还不如一只猫。LeCun认为，依靠文本训练的AI系统无法达到人类水平的智能。他预测，未来人们将普遍佩戴智能眼镜或其他智能设备，形成个人的智能虚拟团队，以提高个人的创造性和效率。他强调，智能系统的目的不是为了取代人类，而是为了增强人类的智力。LeCun还提到，FAIR实验室已经转变研究方向，不再专注于语言模型，而是朝向下一代AI系统的长期目标迈进。他建议放弃生成模型、概率模型、对比学习和强化学习，转而采用JEPA架构和基于能量的模型，认为这些方法更有可能推动AI的发展。最后，LeCun认为，尽管机器最终会超越人类智力，但它们将受到控制，因为它们是目标驱动的。