每日一看大模型新闻(2023.12.04)首个无自然语言的大型视觉模型发布;文字顺序不影响GPT-4阅读理解;研究发现向ChatGPT承诺小费,回复会更详细;哈工大(深圳)推出多模态大模型「九天」

1.产品发布

1.1恒山光量子算力平台公测上线

发布日期:2023.12.04

中国移动联合玻色量子共同打造的恒山光量子算力平台公测上线_服务_用户_模拟

主要内容:中国移动云能力中心与北京玻色量子合作推出了“五岳量子计算云平台——恒山光量子算力平台”,该平台在苏州正式发布。这是继玻色量子于2023年5月16日发布国内首台100量子比特相干光量子计算机真机“天工量子大脑”之后的又一重要里程碑。恒山光量子算力平台面向政企和科研用户开放,用户可以在注册开通“五岳”量子云服务后,通过控制台页面访问恒山光量子算力服务,并订购真机算力服务。现在,“恒山光量子算力平台”已正式开启公测。“五岳”量子计算云平台是一个融合光量子物理算力和经典算力的全栈量子计算云平台,为科研用户提供了云上可调用的光量子计算机算力资源以及多种类型的量子算法和应用的模拟仿真服务。其中,“恒山光量子算力平台”实现了100计算量子比特相干光量子计算机安全接入移动云算力底座,端到端地支持“数据构建、任务提交、安全鉴权、状态监控、消息互传”,并提供持续稳定的任务型量子真机算力服务。

公测申请入口:移动云官网-云擎未来,智信天下

1.2字节跳动计划推出AI平台,允许用户自创聊天机器人

发布日期:2023.12.04

消息称字节跳动ByteDance将推出AI平台 允许用户自创聊天机器人| 科技讯

主要内容:据消息称,字节跳动计划推出一个AI平台,允许用户自主创建聊天机器人,以加强在生成式人工智能领域的竞争。根据备忘录显示,该平台预计将在本月底推出公开测试版,旨在探索新的生成式AI产品,并将其整合到现有产品中。字节跳动还在开发自己的文本转图像生成器,类似于Midjourney。作为中国最有价值的独角兽企业之一,字节跳动一直在利用人工智能技术,其推荐算法被认为是抖音等成功产品的关键因素之一。这一举措将进一步巩固字节跳动在AI领域的地位,为用户提供更多创造和互动的机会。

1.3哈工大(深圳)推出多模态大模型「九天」

发布日期:2023.12.04

横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%-51CTO.COM

主要内容:这个研究提出了双层知识增强的多模态大语言模型-九天(JiuTian-LION),通过注入细粒度空间感知视觉知识和高层语义视觉证据,有效提升了MLLMs的视觉理解能力,生成更准确的文本回应,减少了MLLMs的幻觉现象。该方法主要从两方面增强MLLMs,渐进式融合细粒度空间感知视觉知识,和软提示下的高层语义视觉证据。

论文链接: https://arxiv.org/abs/2311.11860

GitHub: https://github.com/rshaojimmy/JiuTian 

项目主页: JiuTian-LION - Project Page

1.4首个无自然语言的大型视觉模型发布

发布日期:2023.12.04

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花 - 知乎

主要内容:来自BAIR和约翰斯·霍普金斯大学的团队发表了一篇论文,推出了首个无需自然语言数据的大型视觉模型(LVM,Large Vision Models)。该研究团队引入了一种新的序列建模方法,可以在没有任何语言数据的情况下学习LVM。论文定义了一种通用格式,即"视觉句子",用于表示原始图像和视频以及带有语义分割和深度重建等注释数据源,而无需除像素之外的其他元知识。通过将包含4200亿个标记的各种视觉数据表示为序列,模型可以通过最小化交叉熵损失进行下一个标记预测的训练。通过对不同规模的模型架构和数据多样性进行训练,论文提供了实证证据表明该模型具有有效的可扩展性。在测试阶段,通过设计适当的视觉提示,可以解决许多不同的视觉任务。该项目的源代码、模型和数据集将来会开源。

论文地址:https://arxiv.org/abs/2312.00785

项目主页:Large Vision Models

2.商业动态

2.1 AI智能决策公司悠桦林完成近亿元C+轮融资

发布日期:2023.12.04

悠桦林完成近亿元C+轮融资,巩固AI智能决策行业领先地位

主要内容:AI智能决策公司悠桦林微信公众号今日发布文章称,悠桦林近日完成了近1亿元人民币的C+轮融资,由上汽恒旭领投。这轮融资将用于加强悠桦林在运筹优化领域的技术优势和招募顶级行业人才,持续完善算法、产品和服务体系,特别是在智能供应链计划和排程优化平台方面的创新和深化,加快智能化决策解决方案的商业化步伐。

2.2奥特曼宫斗戏新爆料:投资芯片公司,OpenAI签下3.6亿订购单

发布日期:2023.12.04

奥特曼宫斗戏新爆料:自己投芯片公司,让OpenAI签下3.6亿订购单_Rain_投资_神经

主要内容:最新爆料揭示,奥特曼在担任OpenAI的CEO期间,策划了一笔高达3.6亿元人民币的交易,承诺从自己参与投资的初创公司Rain AI购买芯片。这引发了一些争议,因为这笔交易可能涉及潜在利益冲突。Rain AI是一家总部位于旧金山的公司,专注于基于神经拟态技术的AI芯片。奥特曼曾以个人名义向Rain投资100万美元。尽管有人质疑这笔交易的透明度,但双方已于2019年签署了协议,约定OpenAI购买Rain的芯片。这一举动反映了OpenAI在应对GPU短缺和提高计算能力方面的挑战。虽然OpenAI已经采取了一系列措施来应对计算成本问题,但依然面临着算力瓶颈。同时,奥特曼还在探索其他芯片投资和自研AI芯片的可能性,以减少对英伟达等供应商的依赖。这些举措将有望推动AI芯片领域的竞争与创新。

3.其他资讯

3.1 AI生成一张图像的成本?

发布日期:2023.12.04

How many phone charges does an AI-generated image take? - The Verge

主要内容:根据即将公开发表的研究,使用AI生成一张图像的成本大约为1美元。知名的AI社区Hugging Face和卡内基梅隆大学的研究人员发现,通用AI模型(如GPT-4)相比为谷歌翻译等产品提供动力的专用模型,耗电量要多得多,甚至可以说是“多出几个数量级”。举例来说,最低效的图像生成模型生成一张图像所产生的二氧化碳排放量相当于一辆普通汽油车行驶4英里(约合6.44公里)所产生的排放量。

3.2文字顺序不影响GPT-4阅读理解

发布日期:2023.12.04

文字序顺不响影GPT-4阅读理解,别的大模型都不行 | 量子位

主要内容:日本东京大学的一项实验,发现GPT-4在处理乱序的文字时表现出了惊人的能力。通过对乱序的句子进行恢复和问答任务的测试,GPT-4的表现远超其他模型,保持了高恢复率和准确性。不仅如此,随着干扰难度的增加,GPT-4的性能仍然保持稳定,而其他模型则出现显著下降。这项实验为大模型抗文字错乱干扰能力提供了有力的证据。

5.8研究发现向ChatGPT承诺小费,回复会更详细

发布日期:2023.12.04

https://twitter.com/ylecun/status/1730713022195470541?s=20

主要内容:开发者@voooooogel在社交平台X上发文,表示向ChatGPT提问时承诺给予小费,将获得更详细的回复。该开发者使用gpt-4-1106-preview模型进行测试,基准提示是“你能向我展示使用PyTorch的简单卷积网络的代码吗”,然后附加了“不会给小费”、“给20美元小费”或“给200美元小费”的条件,并计算了5个回复的平均长度。测试结果显示,当提问中未提及小费时,回答的字符数低于基准的2%;当提出给予20美元小费时,回答的字符数高于基准的6%;当提出给予200美元小费时,回答的字符数高于基准的11%。据称,回答字符数增加的原因是ChatGPT提供了更详细的问题解释或在答案中添加了额外的相关内容,而不仅仅是对提出的问题进行评论。例如,在提供200美元小费时,ChatGPT自动添加了关于使用CUDA进行训练的部分,而问题本身并未明确提及。

  • 28
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值