以下是2025年4月12日的AI新闻日报:
商业圈
• 谷歌或研发Transformer继任者:谷歌正在探索Transformer架构的继任者,并试图整合长期记忆功能,以推动AGI(通用人工智能)的发展。
• OpenAI组建战略部署团队:OpenAI成立了战略部署团队,加速AGI的落地,表明其在人工智能领域的长远布局和对通用人工智能的重视。
• Shopify转型AI优先:Shopify将内部文档作为关键,加速AI整合,推动公司向AI优先的商业模式转型,以提升业务效率和创新能力。
• 谷歌云与Ai2深化开源模型合作:谷歌云与艾伦人工智能研究所(Ai2)深化合作,在Vertex AI上提供完全开源、可透明审计和定制的Ai2模型,进一步推动开源模型的发展和应用。
• 微软取消俄亥俄州数据中心项目:微软取消了在俄亥俄州建设10亿美元数据中心的项目,这可能与数据中心的环境影响、成本效益等因素有关。
论文项目
• 工程AI系统化研究:有新论文提出工程AI系统开发的ABCDE元素与八层框架,为AI在软件工程领域的系统化开发提供了理论基础和指导框架,有助于推动AI技术在软件工程中的更广泛应用和深入发展。
• Late Chunking解决RAG上下文丢失问题:Late Chunking技术的研究和应用,有效解决了RAG(Retrieval-Augmented Generation)模型在处理长文本时上下文丢失的问题,提升了模型在长序列处理方面的性能,为AI在自然语言处理领域的进一步发展提供了技术支持。
• 多LLM动态切换技术:多LLM动态切换(ModelSwitch)技术的研究,提升了AI系统的效率和灵活性。通过在不同的语言模型之间动态切换,可以根据具体的任务需求选择最适合的模型,从而提高系统的整体性能和资源利用率。
普通用户可以接触到的新模型工具
• Qwen3-Coder:腾讯即将发布的Qwen3-Coder模型,预期更小、更快,支持更长上下文和内联编辑功能。该模型将为开发者提供更高效、更便捷的代码生成和编辑体验,有望进一步提升软件开发的效率和质量。
• VSCode Copilot预览版支持BYOK:VSCode Copilot预览版支持BYOK(Bring Your Own Knowledge),允许用户接入自定义模型,如Anthropic、Gemini、Ollama等。这意味着普通用户可以根据自己的需求和偏好选择合适的AI模型,为代码生成、审查等开发任务提供更个性化的支持。
• Ideogram2a:Ideogram推出了新模型“Ideogram2a”,其生成速度显著提升,成本降低至一半,尤其在英文排版设计方面表现出色,几乎无瑕疵。普通用户可以通过该模型更快速、更低成本地生成高质量的图像和排版设计,满足在内容创作方面的需求。