本文链接：https://blog.csdn.net/gzu_01/article/details/137716270

GPT-4Turbo重回王座，ChatGPT免费升级，数学暴涨10%/上下文全面碾压
OpenAI内斗第二弹，Ilya亲信、超级对齐团队2人惨遭开除，被批泄密
用AI帮企业跑通财税服务全流程，「创业爸爸」获1000万元融资
谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩
这款AI文献神器，能让“论文党”少掉些头发
AIPin媒体评测解禁：AI时代的「美丽废物」
谷歌大脑DeepMind「婚后」貌合神离，Hassabis怨气冲天，1+1<1
俄罗斯搜索巨头YandexAds：AI能协助客户管理70%广告营销
狂飙500天，国产大模型如何突破商业化之困？
硅谷CEO立「千万赌约」，邀马斯克应战：“我用1000万美元，赌你的AI预测是错的！”

GPT-4 Turbo重回王座，ChatGPT免费升级，数学暴涨10%/上下文全面碾压

新版GPT-4Turbo超越Claude3Opus成为大模型排行榜首位，其在64k长文本处理上接近旧版26k时的性能。GPT-4Turbo在数学能力、写作、逻辑推理和编码等方面提升明显，数学能力进步约10%。OpenAI介绍新模型回复更直接，口语化。评估结果显示，GPT-4Turbo在多项基准测试中全面优于前作，尤其在编程、推理和长查询处理上表现出色。在LLM排位赛中，GPT-4-Turbo夺魁。尽管语言使用多样化影响了排名，但总体上，GPT-4Turbo展示了强大的综合能力。
在这里插入图片描述

OpenAI内斗第二弹，Ilya亲信、超级对齐团队2人惨遭开除，被批泄密

OpenAI发生人事动荡，两名研究员因涉嫌泄密被解雇，这是自Sam Altman回归董事会后首次公开的人事调整。被解雇者之一Leopold Aschenbrenner是首席科学家Ilya Sutskever的支持者，超级对齐团队关键人物，该团队旨在研发控制超级智能的技术。Aschenbrenner和另一名员工Pavel Izmailov曾参与重要研究，但具体泄露信息未明。OpenAI的发展继续强劲，而对齐团队的理念和存在引发内部争议。这次解雇可能与理念冲突有关，其中包括有效利他主义者的观点，如FTX创始人Sam Bankman-Fried所倡导的优先解决AI风险而非短期利益。Aschenbrenner背景优秀，研究领域广泛，而Izmailov在机器学习和贝叶斯模型选择方面有所建树。团队提出的创新模型对齐方法展示了潜力，但仍面临挑战。
在这里插入图片描述

用AI帮企业跑通财税服务全流程，「创业爸爸」获1000万元融资

AI创业公司创业爸爸于近期完成1000万天使轮融资，投资方为海口投资管理有限公司。公司成立于2020年，专注于为中小型企业提供标准化的财税全流程服务，利用AI技术解决行业痛点。创业爸爸依托海南自由贸易港政策的机遇，处理大量企业服务需求，如公司注册和变更。产品线丰富，覆盖初创到成长期全周期服务，并针对不同行业提供专业解决方案。公司已实现盈利，营收和净利润稳步增长，目标市场占有率提升并计划扩大业务版图。投资者赞赏创业爸爸抓住政策机遇，助力海南自贸港发展。

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

谷歌提出Infini-attention机制，将Transformer架构的上下文长度扩展至1M，8B大模型在书籍摘要任务上取得SOTA。这种新机制利用压缩记忆减少内存占用，处理无限长输入，实现114倍压缩比。模型在长文本处理上表现出色，且DeepMind也有相关改进。研究引发学术界关注，有人认为大模型类似高度模块化的软件栈。Infini-Transformer在多个任务中展现出优越性能，但其实际应用和推广还需观察。
在这里插入图片描述

这款AI文献神器，能让“论文党”少掉些头发

名为txyz的AI产品在学术界受到追捧，帮助用户大幅提高论文阅读效率。它能快速定位论文，通过对话功能解答论文内容，包括专业术语、公式解析和研究评价等。txyz整合全球开放资源，覆盖多个学科，支持用户提问和个性化推荐，被誉为科研人员的个人图书馆。创始人严伯钧表示，txyz在深度和质量上优于同类产品，特别在医学、物理等专业领域表现突出。公司正在开发SOAN平台，旨在通过人机交互实操论文中的方法，降低知识应用成本，强调AI教育和自主学习的重要性。
在这里插入图片描述

AI Pin媒体评测解禁：AI时代的「美丽废物」

去年11月，Humane公司推出的AIPin引发科技圈关注，被形容为无屏幕手机。AIPin是一款搭载骁龙八核芯片的AI独立终端，支持触摸、语音、激光投影和手势交互，可用于获取信息、实时翻译和基于环境的问答。然而，首批评测显示AIPin存在严重发热、延迟、反馈不佳、错误回答和翻译质量等问题，且功能相对有限，如只能查看时间、连接部分服务等。媒体普遍认为AIPin目前体验欠佳，不符合购买价值，但认可其尝试探索新型计算设备的可能性，认为智能手机形态存在局限，需要改进。

谷歌大脑DeepMind「婚后」貌合神离，Hassabis怨气冲天，1+1<1

谷歌与DeepMind合并后，创始人Demis Hassabis面临内部不和挑战，需平衡深度研究与产品支持。Gemini项目表现不佳，引发种族歧视回应和人才流失。Hassabis抱怨薪酬问题和媒体对离职的报道。合并初衷未达预期，团队间合作困难，资源争夺与项目调整导致内部幻灭。尽管拥有顶级研究资源，但Hassabis及其团队面临OpenAI的竞争压力，需在研究与商业化间寻找平衡。
在这里插入图片描述

俄罗斯搜索巨头Yandex Ads：AI能协助客户管理70%广告营销

东欧和独联体地区的广告平台YandexAds在北京会议上强调了AI在广告领域的关键作用，其64%的俄罗斯市场份额得益于生成式AI技术，为广告曝光贡献三分之一。俄罗斯移动应用市场，尤其是游戏行业，表现出强大活力。Yandex覆盖俄罗斯用户日常生活，80%以上用户每月使用其服务。YandexAds利用AI生成个性化广告，30%由AI制作，70%广告预算由AI管理。公司通过AI辅助决策和精准定向技术提升广告效果。Yandex致力于支持中国应用发行商在俄市场的发展，随着双边贸易的强劲增长，YandexAds在亚太区特别是中国市场取得显著增长，预计未来将继续扩大影响力。
在这里插入图片描述

狂飙500天，国产大模型如何突破商业化之困？

大模型发展迅速，但AI商业化面临困境。B端如微软和Salesforce提供集成AI的垂直定制服务，C端如OpenAI和Midjourney通过订阅模式向个人用户出售工具。国内企业如百度、360、讯飞也在尝试，但落地难主要在于企业未找到商业化思路和盈利模式，大模型训练成本高且迭代周期短。B端关注ROI、数据安全和整合成本，C端消费者付费意愿上升但营收压力大。360通过浏览器结合AI办公寻求变现，采用会员订阅模式。海外C端产品如ChatGPT等采用订阅制，聚焦通用场景。国内企业如360在AI办公领域商业化落地，利用浏览器场景优势。商业化关键在于深入理解用户需求，提供定制化解决方案。大模型虽面临算力成本和数据安全等问题，但商业化前景广阔。

硅谷 CEO 立「千万赌约」，邀马斯克应战：“我用 1000 万美元，赌你的 AI 预测是错的！”

特斯拉CEO马斯克预言2025年人工智能将超越人类个体，这一言论引发了AI专家Gary Marcus的100万美元赌约，后增至1000万美元。赌约围绕是否会出现比人类更聪明的AI。Gary认为现有模型虽有进步但无决定性优势，进入了一个收益递减的时代，而他预计不会有重大突破，比如GPT-5。马斯克尚未回应赌约，且GaryMarcus继续质疑并嘲讽。这场关于AI未来的赌局引发了关于AI能力、衡量标准的讨论。