AI Repos
1、GraphAgent
人大和阿里开源的,支持十万级节点图谱生成的框架:GraphAgentGenerator,模拟速度提高了90.4%。GAG利用LLM中预训练的社会共识知识,通过模拟人与物体的互动来生成动态的带有文本属性的社交图。比如模拟一个学术圈的社交网络,它会根据学者们的个人资料,像研究方向、发表的论文等来模拟他们的行为,生成相应的社交网络图。GAG生成结果可以展现真实世界网络的七个关键结构特征,幂律度分布、小世界特性、直径收缩等。在图扩展任务中,GAG在特定评估指标上比性能最佳的基线模型提高了 11%
2、R1-Omni
阿里放出了一款情感识别模型:R1-Omni。它能通过看视频来识别人的情绪,像人在看电视剧时能感受到演员的喜怒哀乐一样。R1-Omni是一款基于强化学习与可验证奖励的全模态大模型,利用视觉和音频信息来识别情感,它把RLVR用于模型中,来提高模型在情感识别方面的推理、理解和泛化能力。能看、能听、会分析、能生成详细且可解释的推理过程
3、MM_StoryAgent
上交大和阿里开源的一款AI多模态故事生成系统:MM-StoryAgent,多模态、多智能体框架
可以自动生成包含文字、图像以及多声道音频(旁白、音效、背景音乐)的故事视频,可用于儿童故事快速创作。故事生成采用多阶段写作流程,模拟专家和新手作家对话来优化故事质量,先生成故事大纲,再扩展为完整章节。框架中设计了多个智能体,把原始故事文本转换为模态特定的提示,通过“修订-审核”机制迭代优化提示,确保文本内容与不同模态的一致性,以及图像生成部分的角色一致性
4、open-mcp-client
让我们在任何应用中与 MCP 服务器聊天,只需从 Composio 获取 URL。包含网页版 MCP 客户端和可集成到任何应用的开源库。基于 CopilotKit 和 LangChain LangGraph,部署在 Vercel 平台上。
5、PromptJailbreakManual
一份系统全面的 Prompt 设计与越狱技巧指南:Prompt越狱手册。这份开源资源不仅详解 Prompt 构建本质与思维模式,还提供丰富的攻防实例和框架模板,帮助解决 AI 使用过程中的各种挑战。
6、agents
Cloudflare 开源的 AI 智能体开发框架:Cloudflare Agents。这是一个用于构建智能、有状态的 AI 智能体的框架,让 AI 能够在网络边缘持久化存在、思考和进化,开创了 AI 开发的新范式。
AI News
1、TrajectoryCrafter:单目视频实现相机自由运镜
TrajectoryCrafter 是一项基于扩散模型(diffusion models)的创新技术,能够从单目视频中推断并生成全新的视角。该技术允许在后期自由调整视频的相机位置和角度,还能轻松改变视频中的运镜方式。例如,你可以绕着某个物体旋转、拉近或拉远镜头,甚至实现“林克时间”效果。
2、Squish Effect:基于 Wan2.1 的捏捏乐 LoRA 特效开源复现
Squish Effect 是基于 Wan2.1 14B I2V 480p 训练而来的 LoRA,这一 AI 特效最初起源于 Pika,昨天,可灵也宣布支持这一特效,现在可以通过开源方式复现了!
3、Flat Color LoRA:基于 Wan2.1 的扁平风格动画生成
Flat Color 是基于 Wan2.1 训练而来的 LoRA,专注于生成扁平风格(Flat Color)的动画视频。这种风格的特点没有明显线条(no lineart)、使用平坦色彩(flat colors)并且几乎没有深度感(little to no depth)。
4、AI大模型行业动态:技术突破与跨界合作加速发展
人工智能大模型领域近期动态频出,技术与合作持续推进。英伟达因ChatGPT热潮市盈率飙升,被视为潜在“苹果式”神话;国泰君安称AI将引领证券业进入“智能认知”时代。广州算力中心接入阿里通义千问,科大讯飞凭国产算力卡跻身主流研发阵营。全球层面,OpenAI与CoreWeave签119亿美元合同,微软聚焦系统整合。北大TransPharmer模型革新药物研发,富士康推出“FoxBrain”融合制造业。AI大模型应用日益广泛,未来影响深远。
5、新型AI工具可提前预测大脑退化,或革新痴呆症治疗
麻省总医院和布里根妇女医院研发出一款AI工具,能通过分析睡眠中脑电图(EEG)数据,提前数年预测大脑退化。研究追踪281名65岁以上女性五年,利用AI检测深度睡眠伽马波变化,成功预测85%的认知退化案例,准确率达77%。此工具为痴呆症早期干预提供可能,结合生活方式调整或延缓疾病进展。研究已发表在《阿尔茨海默病杂志》,未来需更大规模验证以推广应用。
6、网易有道发布14B小参数翻译大模型,精度与效率双提升
网易有道推出子曰翻译大模型2.0的14B小参数垂类模型,显著提升翻译精度与效率。该模型凭借低资源消耗和强适应性,已集成至有道词典、翻译官及词典笔X7等产品。依托高质量语料、人工标注及算法优化(如大模型蒸馏),新模型在中英文互译中表现优异。新增Reward Model和人工评估进一步保障翻译质量。有道翻译用户超10亿,月活超1亿,连续六年领跑教育工具领域,未来将深耕垂类模型发展。
7、阿里巴巴AI搜索引擎Accio用户破百万,新增功能助力全球贸易
阿里巴巴旗下AI搜索引擎Accio于2025年3月11日用户数突破百万,展现其在全球B2B贸易中的影响力。近期,Accio接入DeepSeek等先进推理模型,新增深度研究和商业探索功能,为中小企业提供智能、高效的贸易支持。此举标志着阿里国际站利用尖端AI技术赋能外贸业务,满足市场对AI工具的强劲需求,进一步推动全球贸易生态发展。
8、真我realme UI 6.0小布助手接入DeepSeek-R1,提升智能交互体验
真我realme UI 6.0的小布助手正式接入DeepSeek-R1满血版,覆盖GT7Pro、Neo7等六款机型。此次升级带来多轮交互、深度思考及一键语音唤醒功能,用户可快速生成旅游攻略或工作文档。新增边问边写和长按电源键唤醒设计,优化了交互流畅性与效率,为用户提供更智能、便捷的操作体验,显著提升realme手机的实用性。
9、高通收购Edge Impulse,推动AI与物联网融合新格局
高通宣布收购Edge Impulse,强化其在AI与物联网领域的领导地位。此次收购助力高通推出全面解决方案,包括定制芯片组、统一软件架构及服务套件,覆盖消费电子、智慧医疗等多个领域。高通还将提供开发者工具包并深化生态合作,加速工业智能化转型。通过整合硬件、软件及服务,高通旨在提升物联网应用的效率、安全性与普及度,为行业发展注入新动力。