- GPT-4Turbo重回王座,ChatGPT免费升级,数学暴涨10%/上下文全面碾压
- OpenAI内斗第二弹,Ilya亲信、超级对齐团队2人惨遭开除,被批泄密
- 用AI帮企业跑通财税服务全流程,「创业爸爸」获1000万元融资
- 谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩
- 这款AI文献神器,能让“论文党”少掉些头发
- AIPin媒体评测解禁:AI时代的「美丽废物」
- 谷歌大脑DeepMind「婚后」貌合神离,Hassabis怨气冲天,1+1<1
- 俄罗斯搜索巨头YandexAds:AI能协助客户管理70%广告营销
- 狂飙500天,国产大模型如何突破商业化之困?
- 硅谷CEO立「千万赌约」,邀马斯克应战:“我用1000万美元,赌你的AI预测是错的!”
GPT-4 Turbo重回王座,ChatGPT免费升级,数学暴涨10%/上下文全面碾压
新版GPT-4Turbo超越Claude3Opus成为大模型排行榜首位,其在64k长文本处理上接近旧版26k时的性能。GPT-4Turbo在数学能力、写作、逻辑推理和编码等方面提升明显,数学能力进步约10%。OpenAI介绍新模型回复更直接,口语化。评估结果显示,GPT-4Turbo在多项基准测试中全面优于前作,尤其在编程、推理和长查询处理上表现出色。在LLM排位赛中,GPT-4-Turbo夺魁。尽管语言使用多样化影响了排名,但总体上,GPT-4Turbo展示了强大的综合能力。
OpenAI内斗第二弹,Ilya亲信、超级对齐团队2人惨遭开除,被批泄密
OpenAI发生人事动荡,两名研究员因涉嫌泄密被解雇,这是自Sam Altman回归董事会后首次公开的人事调整。被解雇者之一Leopold Aschenbrenner是首席科学家Ilya Sutskever的支持者,超级对齐团队关键人物,该团队旨在研发控制超级智能的技术。Aschenbrenner和另一名员工Pavel Izmailov曾参与重要研究,但具体泄露信息未明。OpenAI的发展继续强劲,而对齐团队的理念和存在引发内部争议。这次解雇可能与理念冲突有关,其中包括有效利他主义者的观点,如FTX创始人Sam Bankman-Fried所倡导的优先解决AI风险而非短期利益。Aschenbrenner背景优秀,研究领域广泛,而Izmailov在机器学习和贝叶斯模型选择方面有所建树。团队提出的创新模型对齐方法展示了潜力,但仍面临挑战。
用AI帮企业跑通财税服务全流程,「创业爸爸」获1000万元融资
AI创业公司创业爸爸于近期完成1000万天使轮融资,投资方为海口投资管理有限公司。公司成立于2020年,专注于为中小型企业提供标准化的财税全流程服务,利用AI技术解决行业痛点。创业爸爸依托海南自由贸易港政策的机遇,处理大量企业服务需求,如公司注册和变更。产品线丰富,覆盖初创到成长期全周期服务,并针对不同行业提供专业解决方案。公司已实现盈利,营收和净利润稳步增长,目标市场占有率提升并计划扩大业务版图。投资者赞赏创业爸爸抓住政策机遇,助力海南自贸港发展。
谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩
谷歌提出Infini-attention机制,将Transformer架构的上下文长度扩展至1M,8B大模型在书籍摘要任务上取得SOTA。这种新机制利用压缩记忆减少内存占用,处理无限长输入,实现114倍压缩比。模型在长文本处理上表现出色,且DeepMind也有相关改进。研究引发学术界关注,有人认为大模型类似高度模块化的软件栈。Infini-Transformer在多个任务中展现出优越性能,但其实际应用和推广还需观察。
这款AI文献神器,能让“论文党”少掉些头发
名为txyz的AI产品在学术界受到追捧,帮助用户大幅提高论文阅读效率。它能快速定位论文,通过对话功能解答论文内容,包括专业术语、公式解析和研究评价等。txyz整合全球开放资源,覆盖多个学科,支持用户提问和个性化推荐,被誉为科研人员的个人图书馆。创始人严伯钧表示,txyz在深度和质量上优于同类产品,特别在医学、物理等专业领域表现突出。公司正在开发SOAN平台,旨在通过人机交互实操论文中的方法,降低知识应用成本,强调AI教育和自主学习的重要性。
AI Pin媒体评测解禁:AI时代的「美丽废物」
去年11月,Humane公司推出的AIPin引发科技圈关注,被形容为无屏幕手机。AIPin是一款搭载骁龙八核芯片的AI独立终端,支持触摸、语音、激光投影和手势交互,可用于获取信息、实时翻译和基于环境的问答。然而,首批评测显示AIPin存在严重发热、延迟、反馈不佳、错误回答和翻译质量等问题,且功能相对有限,如只能查看时间、连接部分服务等。媒体普遍认为AIPin目前体验欠佳,不符合购买价值,但认可其尝试探索新型计算设备的可能性,认为智能手机形态存在局限,需要改进。
谷歌大脑DeepMind「婚后」貌合神离,Hassabis怨气冲天,1+1<1
谷歌与DeepMind合并后,创始人Demis Hassabis面临内部不和挑战,需平衡深度研究与产品支持。Gemini项目表现不佳,引发种族歧视回应和人才流失。Hassabis抱怨薪酬问题和媒体对离职的报道。合并初衷未达预期,团队间合作困难,资源争夺与项目调整导致内部幻灭。尽管拥有顶级研究资源,但Hassabis及其团队面临OpenAI的竞争压力,需在研究与商业化间寻找平衡。
俄罗斯搜索巨头Yandex Ads:AI能协助客户管理70%广告营销
东欧和独联体地区的广告平台YandexAds在北京会议上强调了AI在广告领域的关键作用,其64%的俄罗斯市场份额得益于生成式AI技术,为广告曝光贡献三分之一。俄罗斯移动应用市场,尤其是游戏行业,表现出强大活力。Yandex覆盖俄罗斯用户日常生活,80%以上用户每月使用其服务。YandexAds利用AI生成个性化广告,30%由AI制作,70%广告预算由AI管理。公司通过AI辅助决策和精准定向技术提升广告效果。Yandex致力于支持中国应用发行商在俄市场的发展,随着双边贸易的强劲增长,YandexAds在亚太区特别是中国市场取得显著增长,预计未来将继续扩大影响力。
狂飙500天,国产大模型如何突破商业化之困?
大模型发展迅速,但AI商业化面临困境。B端如微软和Salesforce提供集成AI的垂直定制服务,C端如OpenAI和Midjourney通过订阅模式向个人用户出售工具。国内企业如百度、360、讯飞也在尝试,但落地难主要在于企业未找到商业化思路和盈利模式,大模型训练成本高且迭代周期短。B端关注ROI、数据安全和整合成本,C端消费者付费意愿上升但营收压力大。360通过浏览器结合AI办公寻求变现,采用会员订阅模式。海外C端产品如ChatGPT等采用订阅制,聚焦通用场景。国内企业如360在AI办公领域商业化落地,利用浏览器场景优势。商业化关键在于深入理解用户需求,提供定制化解决方案。大模型虽面临算力成本和数据安全等问题,但商业化前景广阔。
硅谷 CEO 立「千万赌约」,邀马斯克应战:“我用 1000 万美元,赌你的 AI 预测是错的!”
特斯拉CEO马斯克预言2025年人工智能将超越人类个体,这一言论引发了AI专家Gary Marcus的100万美元赌约,后增至1000万美元。赌约围绕是否会出现比人类更聪明的AI。Gary认为现有模型虽有进步但无决定性优势,进入了一个收益递减的时代,而他预计不会有重大突破,比如GPT-5。马斯克尚未回应赌约,且GaryMarcus继续质疑并嘲讽。这场关于AI未来的赌局引发了关于AI能力、衡量标准的讨论。