AI大模型日报#0622:Claude 3.5 Sonnet超越GPT-4o、盘古大模型跳级发布、松鼠AI多模态教育大模型

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:中科大与上海AI Lab等团队发布了高质量视频数据集ShareGPT4Video,通过GPT-4v的视觉能力实现视频的高质量描述,对视频理解和生成任务有着重要意义。同时,OpenAI收购数据库初创公司Rockset,增强检索基础设施,暗示下一代模型GPT-5的研发方向。华为在HDC2024上发布了盘古大模型5.0,强调多模态和强思维属性,并展示了在多个领域的应用能力。松鼠Ai则发布了全新多模态智适应教育大模型,推出子品牌及智能老师终端设备,旨在推动教育公平和智能化。此外,字节跳动和华中科大联合发布了多语种视觉文本理解评测基准MTVQA Bench,香港大学推出了可解释的推荐系统大模型XRec,Anthropic发布了全面超越GPT-4o的Claude 3.5 Sonnet。在大模型产品化的第一年,战术、运营与战略层面的经验分享也成为焦点。这些进展共同推动了AI大模型领域的发展,拓展了应用场景,提升了技术性能。

标题: 百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品
摘要: 中科大与上海AI Lab等组成的ShareGPT4V团队发布了新的高质量视频数据集,该数据集包含3000小时的视频及详细文字描述,旨在提升视频生成质量。团队利用GPT-4v的视觉能力,通过精心设计的描述策略,实现了对任意视频的高质量描述,并推出ShareGPT4Video数据集,其中包含4万条标注视频数据。研究者还开发了ShareCaptioner-Video模型,可自动生成视频描述,进一步将数据集规模拓展至480万条。该数据集在视频理解和生成任务上均表现出色,已开源并登上HuggingFace排行榜榜首。
网址: 百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品 | 量子位
 
标题: OpenAI 36亿收购数据库初创公司,CTO剧透GPT-5
摘要: OpenAI以36亿人民币收购了由Facebook工程师创立的数据库初创公司Rockset,主打实时搜索和数据分析。该收购将增强OpenAI的检索基础设施,并整合Rockset的技术,以支持AI模型的准确性和性能。此举被网友视为OpenAI迈向B端市场的重要举措,同时可能为其搜索引擎铺路。此外,OpenAI CTO暗示下一代模型GPT-5可能在一年半后问世,目标是在特定任务上达到博士水平。
网址: OpenAI 36亿收购数据库初创公司,CTO剧透GPT-5 | 量子位
 
标题: 华为发布会杀疯了:盘古大模型跳级发布,编程语言仓颉首次亮相


摘要: 在HDC2024上,华为发布了盘古大模型5.0,跳过4.0版本,直接推出覆盖十亿、百亿、千亿、万亿四种规模的系列,强调多模态和强思维属性。盘古大模型展示了在机器人、自动驾驶等领域的应用能力,并揭秘了背后的技术细节。此外,华为还介绍了鸿蒙系统的最大升级,包括全新系统架构和自研仓颉编程语言的亮相,实现了操作系统技术的全面突破。余承东表示原生鸿蒙正在全力冲刺,鸿蒙生态正逐步完善。
网址: 华为发布会杀疯了:盘古大模型跳级发布,编程语言仓颉首次亮相 | 量子位
 
标题: 松鼠Ai新品发布会正式启幕,都有哪些突破式迭代?
 


摘要: 松鼠Ai近日发布全新多模态智适应教育大模型,并推出子品牌“松果”及三款搭载智能老师的终端设备。新模型通过优化教学体验、引入创新功能,提高算法准确率,实现更深度的智能化分析,辅助学生提升成绩。同时,新模型拓展学习模块,满足不同年龄阶段需求,推动终身智能教育。此举旨在促进教育公平,让更多学生享受智适应教育,以技术创新推动教育事业高质量发展。松鼠Ai创始人栗浩洋表示,多模态智适应教育系统将推动“新”教育革命,助力教育领域实现大规模因材施教和精准教学。
网址: 松鼠Ai新品发布会正式启幕,都有哪些突破式迭代? | 量子位
 
标题: 多模态大模型的多语种文字理解能力还有很长的路要走,字节、华科联合发布MTVQA Bench
摘要: 字节跳动和华中科大联合发布了新的多语种视觉文本理解评测基准MTVQA Bench,旨在填补多模态大模型(MLLM)在多语种环境下的评估空白。该基准涵盖了9种语言,测试结果显示现有最先进的模型如GPT-4o准确率不到30%,表明多语种文字理解能力仍有很大提升空间。研究者希望MTVQA能促进多语种文字理解能力的发展,让多模态大模型的成果惠及更多国家和地区。
网址: 多模态大模型的多语种文字理解能力还有很长的路要走,字节、华科联合发布MTVQA Bench | 量子位
 
标题: 全球首个全学科智适应教育大模型升级!AI孔子/达芬奇/爱因斯坦组团当家教
 


摘要: 松鼠Ai在上海举行发布会,推出全新多模态智适应大模型及系统升级,同时发布多款智适应教育硬件产品,标志着智适应教育新时代的到来。新大模型在多模态智能错因分析、人机互动和测试评估上实现全面迭代,引入草稿纸内容智能分析,算法准确度达90%以上。智适应教育系统新增学龄前教育、科学学科和跨学科能力培养模块。此外,发布三款全新AI智能老师,构建全面智适应学习生态,包括旗舰之作S211白鹭、全能性价比机型S139和子品牌「松果」的Z29松果Ai智能老师,以及升级的智能扫读笔和耳机,旨在推广智适应教育,促进教育数字化与公平化。松鼠Ai展现教育AI的无限可能,以科技赋能教育,加速未来学习革命和教育普惠的到来。
网址: 全球首个全学科智适应教育大模型升级!AI孔子/达芬奇/爱因斯坦组团当家教|达芬奇|爱因斯坦|孔子_新浪新闻
 
标题: 打开黑盒神经网络!港大推出全新「会说话」的推荐系统大模型XRec,从黑盒预测到可解释
 


摘要: 香港大学数据智能实验室推出了一款名为XRec的全新智能大模型,该模型通过融合大型语言模型的语义理解和协同过滤技术,增强了推荐系统的可解释性,使用户能够理解推荐背后的逻辑。XRec不仅能给出准确的推荐结果,还能用通俗易懂的语言向用户解释推荐依据,提升了用户体验。该模型采用图神经网络和图表示学习技术来捕捉用户偏好,并通过轻量级适配器模块对齐不同语义模态,有效整合协同信号和文本语义。XRec在多个公开数据集上验证表现出色,具有优越的可解释性和稳定性,同时在不同数据稀疏性场景下也展现出良好的泛化能力。这一创新成果为推荐系统的未来发展提供了新方向和动力。
网址: 打开黑盒神经网络!港大推出全新「会说话」的推荐系统大模型XRec,从黑盒预测到可解释 - 智源社区
 
标题: 刚刚,OpenAI最强竞对发布Claude 3.5 Sonnet,全面超越GPT-4o,重新定义交互方式
 


摘要: Anthropic发布了Claude 3.5系列模型的首个版本——Claude 3.5 Sonnet,该模型在各种评估中均优于竞争对手,如GPT-4o和Gemini 1.5,并在智能化、速度、成本方面有所提升。它可在网页版和iOS应用上免费使用,并为Pro和Team计划用户提供更高访问权限。Claude 3.5 Sonnet在研究生水平推理、本科生知识及编码能力方面树立了新基准,运行速度为前代的两倍,并具有优秀的视觉模型表现。此外,Anthropic还推出了Artifacts功能,扩展用户与Claude的交互方式,旨在将人工智能生成内容无缝集成到用户项目和工作流程中。未来,Anthropic计划继续发布更多Claude 3.5系列模型,并开发新功能和模态,以支持更多企业用例。
网址: 刚刚,OpenAI最强竞对发布Claude 3.5 Sonnet,全面超越GPT-4o,重新定义交互方式 - 智源社区
 
标题: 大模型产品化第一年​:战术、运营与战略
 


摘要: 本文要点提炼: 1. 语言大模型(LLM)已达到可应用于现实场景的水平,且逐年迭代优化。 2. 预计到2025年,AI领域投资将达到2000亿美元,LLM通过供应商API易于访问,使得非ML工程师和科学家也能将AI融入产品。 3. 尽管AI门槛降低,但创建有效产品和系统仍具挑战性。 4. 经验分享涵盖战术、运营和战略三个层面,适用于不同角色和需求。 5. 战术层面聚焦于提示技巧、评估、检索增强生成(RAG)和人机协作流程设计。 6. 提示技巧包括n-shot提示、思维链(CoT)和提供相关背景资源,有助于提升模型性能和输出质量。 7. 结构化输入和输出有助于模型理解和系统集成,不同LLM系列对格式有偏好。 8. 编写小而精的提示,专注于单一功能,有助于构建稳健的LLM应用。
网址: 大模型产品化第一年​:战术、运营与战略 - 智源社区
 

  • 8
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

常政

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值