AI大模型日报#0622：Claude 3.5 Sonnet超越GPT-4o、盘古大模型跳级发布、松鼠AI多模态教育大模型

本文链接：https://blog.csdn.net/lionkingcz/article/details/139883752

导读：AI大模型日报，爬虫+LLM自动生成，一文览尽每日AI大模型要点资讯！

目前采用“文心一言”（ERNIE-4.0-8K-latest）生成了今日要点以及每条资讯的摘要。欢迎阅读！

《AI大模型日报》今日要点：中科大与上海AI Lab等团队发布了高质量视频数据集ShareGPT4Video，通过GPT-4v的视觉能力实现视频的高质量描述，对视频理解和生成任务有着重要意义。同时，OpenAI收购数据库初创公司Rockset，增强检索基础设施，暗示下一代模型GPT-5的研发方向。华为在HDC2024上发布了盘古大模型5.0，强调多模态和强思维属性，并展示了在多个领域的应用能力。松鼠Ai则发布了全新多模态智适应教育大模型，推出子品牌及智能老师终端设备，旨在推动教育公平和智能化。此外，字节跳动和华中科大联合发布了多语种视觉文本理解评测基准MTVQA Bench，香港大学推出了可解释的推荐系统大模型XRec，Anthropic发布了全面超越GPT-4o的Claude 3.5 Sonnet。在大模型产品化的第一年，战术、运营与战略层面的经验分享也成为焦点。这些进展共同推动了AI大模型领域的发展，拓展了应用场景，提升了技术性能。

标题: 百万级高质量视频数据集发布，登顶抱抱脸数据集排行榜，中科大&上海AI Lab等出品
摘要: 中科大与上海AI Lab等组成的ShareGPT4V团队发布了新的高质量视频数据集，该数据集包含3000小时的视频及详细文字描述，旨在提升视频生成质量。团队利用GPT-4v的视觉能力，通过精心设计的描述策略，实现了对任意视频的高质量描述，并推出ShareGPT4Video数据集，其中包含4万条标注视频数据。研究者还开发了ShareCaptioner-Video模型，可自动生成视频描述，进一步将数据集规模拓展至480万条。该数据集在视频理解和生成任务上均表现出色，已开源并登上HuggingFace排行榜榜首。
网址: 百万级高质量视频数据集发布，登顶抱抱脸数据集排行榜，中科大&上海AI Lab等出品 | 量子位

标题: OpenAI 36亿收购数据库初创公司，CTO剧透GPT-5
摘要: OpenAI以36亿人民币收购了由Facebook工程师创立的数据库初创公司Rockset，主打实时搜索和数据分析。该收购将增强OpenAI的检索基础设施，并整合Rockset的技术，以支持AI模型的准确性和性能。此举被网友视为OpenAI迈向B端市场的重要举措，同时可能为其搜索引擎铺路。此外，OpenAI CTO暗示下一代模型GPT-5可能在一年半后问世，目标是在特定任务上达到博士水平。
网址: OpenAI 36亿收购数据库初创公司，CTO剧透GPT-5 | 量子位

标题: 华为发布会杀疯了：盘古大模型跳级发布，编程语言仓颉首次亮相

摘要: 在HDC2024上，华为发布了盘古大模型5.0，跳过4.0版本，直接推出覆盖十亿、百亿、千亿、万亿四种规模的系列，强调多模态和强思维属性。盘古大模型展示了在机器人、自动驾驶等领域的应用能力，并揭秘了背后的技术细节。此外，华为还介绍了鸿蒙系统的最大升级，包括全新系统架构和自研仓颉编程语言的亮相，实现了操作系统技术的全面突破。余承东表示原生鸿蒙正在全力冲刺，鸿蒙生态正逐步完善。
网址: 华为发布会杀疯了：盘古大模型跳级发布，编程语言仓颉首次亮相 | 量子位

标题: 松鼠Ai新品发布会正式启幕，都有哪些突破式迭代？

摘要: 松鼠Ai近日发布全新多模态智适应教育大模型，并推出子品牌“松果”及三款搭载智能老师的终端设备。新模型通过优化教学体验、引入创新功能，提高算法准确率，实现更深度的智能化分析，辅助学生提升成绩。同时，新模型拓展学习模块，满足不同年龄阶段需求，推动终身智能教育。此举旨在促进教育公平，让更多学生享受智适应教育，以技术创新推动教育事业高质量发展。松鼠Ai创始人栗浩洋表示，多模态智适应教育系统将推动“新”教育革命，助力教育领域实现大规模因材施教和精准教学。
网址: 松鼠Ai新品发布会正式启幕，都有哪些突破式迭代？ | 量子位

标题: 多模态大模型的多语种文字理解能力还有很长的路要走，字节、华科联合发布MTVQA Bench
摘要: 字节跳动和华中科大联合发布了新的多语种视觉文本理解评测基准MTVQA Bench，旨在填补多模态大模型(MLLM)在多语种环境下的评估空白。该基准涵盖了9种语言，测试结果显示现有最先进的模型如GPT-4o准确率不到30%，表明多语种文字理解能力仍有很大提升空间。研究者希望MTVQA能促进多语种文字理解能力的发展，让多模态大模型的成果惠及更多国家和地区。
网址: 多模态大模型的多语种文字理解能力还有很长的路要走，字节、华科联合发布MTVQA Bench | 量子位

标题: 全球首个全学科智适应教育大模型升级！AI孔子/达芬奇/爱因斯坦组团当家教

摘要: 松鼠Ai在上海举行发布会，推出全新多模态智适应大模型及系统升级，同时发布多款智适应教育硬件产品，标志着智适应教育新时代的到来。新大模型在多模态智能错因分析、人机互动和测试评估上实现全面迭代，引入草稿纸内容智能分析，算法准确度达90%以上。智适应教育系统新增学龄前教育、科学学科和跨学科能力培养模块。此外，发布三款全新AI智能老师，构建全面智适应学习生态，包括旗舰之作S211白鹭、全能性价比机型S139和子品牌「松果」的Z29松果Ai智能老师，以及升级的智能扫读笔和耳机，旨在推广智适应教育，促进教育数字化与公平化。松鼠Ai展现教育AI的无限可能，以科技赋能教育，加速未来学习革命和教育普惠的到来。
网址: 全球首个全学科智适应教育大模型升级！AI孔子/达芬奇/爱因斯坦组团当家教|达芬奇|爱因斯坦|孔子_新浪新闻

标题: 打开黑盒神经网络！港大推出全新「会说话」的推荐系统大模型XRec，从黑盒预测到可解释

摘要: 香港大学数据智能实验室推出了一款名为XRec的全新智能大模型，该模型通过融合大型语言模型的语义理解和协同过滤技术，增强了推荐系统的可解释性，使用户能够理解推荐背后的逻辑。XRec不仅能给出准确的推荐结果，还能用通俗易懂的语言向用户解释推荐依据，提升了用户体验。该模型采用图神经网络和图表示学习技术来捕捉用户偏好，并通过轻量级适配器模块对齐不同语义模态，有效整合协同信号和文本语义。XRec在多个公开数据集上验证表现出色，具有优越的可解释性和稳定性，同时在不同数据稀疏性场景下也展现出良好的泛化能力。这一创新成果为推荐系统的未来发展提供了新方向和动力。
网址: 打开黑盒神经网络！港大推出全新「会说话」的推荐系统大模型XRec，从黑盒预测到可解释 - 智源社区

标题: 刚刚，OpenAI最强竞对发布Claude 3.5 Sonnet，全面超越GPT-4o，重新定义交互方式

摘要: Anthropic发布了Claude 3.5系列模型的首个版本——Claude 3.5 Sonnet，该模型在各种评估中均优于竞争对手，如GPT-4o和Gemini 1.5，并在智能化、速度、成本方面有所提升。它可在网页版和iOS应用上免费使用，并为Pro和Team计划用户提供更高访问权限。Claude 3.5 Sonnet在研究生水平推理、本科生知识及编码能力方面树立了新基准，运行速度为前代的两倍，并具有优秀的视觉模型表现。此外，Anthropic还推出了Artifacts功能，扩展用户与Claude的交互方式，旨在将人工智能生成内容无缝集成到用户项目和工作流程中。未来，Anthropic计划继续发布更多Claude 3.5系列模型，并开发新功能和模态，以支持更多企业用例。
网址: 刚刚，OpenAI最强竞对发布Claude 3.5 Sonnet，全面超越GPT-4o，重新定义交互方式 - 智源社区

标题: 大模型产品化第一年：战术、运营与战略

摘要: 本文要点提炼： 1. 语言大模型（LLM）已达到可应用于现实场景的水平，且逐年迭代优化。 2. 预计到2025年，AI领域投资将达到2000亿美元，LLM通过供应商API易于访问，使得非ML工程师和科学家也能将AI融入产品。 3. 尽管AI门槛降低，但创建有效产品和系统仍具挑战性。 4. 经验分享涵盖战术、运营和战略三个层面，适用于不同角色和需求。 5. 战术层面聚焦于提示技巧、评估、检索增强生成（RAG）和人机协作流程设计。 6. 提示技巧包括n-shot提示、思维链（CoT）和提供相关背景资源，有助于提升模型性能和输出质量。 7. 结构化输入和输出有助于模型理解和系统集成，不同LLM系列对格式有偏好。 8. 编写小而精的提示，专注于单一功能，有助于构建稳健的LLM应用。
网址: 大模型产品化第一年：战术、运营与战略 - 智源社区