AI Repos
1、mahilo
一款多智能体人机协作框架:mahilo,可以构建相互之间共享上下文信息的多个AI智能体,并且支持人类监督。可以用来做客服系统、教育辅导、销售系统等等。它支持实时API和语音交互,可以自定义智能体,也支持集成其他框架的智能体。点对点通信,支持层级式通信,AI智能体可以根据场景自主决定与哪些其他智能体进行交流。支持人机协作,每个智能体都可以与人类用户实时交互,多个用户可以同时连接到同一个智能体,人可以随时干预智能体的决策。
2、CogView4
智谱开源了其最新的图像生成模型:CogView4,首个支持中英双语提示词的开源文生图模型。尤其擅长理解和遵循中文提示词,能在画面中生成汉字,非常适合做广告、短视频创作等;具备较强的复杂语义对齐和指令跟随能力;支持任意长度的中英双语输入;能够生成在给定范围内的任意分辨率图像;具备较强的文字生成能力。
3、Step-Audio
首个集语音理解与生成控制一体化的产品级开源实时语音对话系统:Step-Audio,支持多语言对话、情感语气、地区方言、可调节语速以及韵律风格;支持中文、英文、日语等多语言;支持粤语、四川话等方言;支持RAP和哼唱;可控制语音情感,比如开心或悲伤。
Step-Audio系列包含三个模型:
(1)Step-Audio-Tokenizer(分词器)
(2)Step-Audio-Chat(130B对话模型)
(3)Step-Audio-TTS-3B(3B语音合成模型)
Step-Audio-Chat,130B多模态模型,单模型能实现理解生成一体化完成语音识别、语义理解、对话、语音克隆、语音生成等;Step-Audio-TTS-3B:基于130B生成高质量的合成音频数据训练,支持RAP和哼唱的指令加强版语音合成模型;通过ToolCall机制和角色扮演增强,可进一步提升其在 Agents和复杂任务中的表现。
4、chat2geo
一款智能地图分析工具:chat2geo,可以用聊天的方式分析卫星图像和地理数据;提供自然语言描述需求,Chat2Geo就能理解并转换为专业的地理分析任务,调用Google地球引擎获取卫星数据进行处理分析;支持处理卫星图像、分析地理数据以及各种专业分析。比如,分析城市问题,查看城市热度分布,检测空气污染情况,观察城市发展变化;做土地分析,可以了解土地使用以及土地变化情况等;支持上传自己的矢量数据,将其与GEE的卫星图像数据结合起来进行分析。
5、hacker-news
一个基于AI的自动化播客项目:hacker-news,它可以每天自动抓取Hacker News热门文章,生成中文总结并转成播客。自动抓取Hacker News每日热门文章,智能总结文章内容和评论,用Edge TTS生成中文播报。支持网页和播客App收听,每日自动更新,可提供文章摘要和完整播报文本。
6、stocks-insights-ai-agent
一款基于AI驱动的智能股票分析工具:stocks-insights-ai-agent,用它可以了解股票表现和相关新闻,它可以自动从网上收集股票价格、公司新闻等,AI分析并以图表、文字等形式展现出来。它可以查看股票表现,画出股票价格的历史走势; 查找特定信息,比如某只股票的某个具体信息; 收集某只股票的相关新闻。其定期异步抓取新闻和财务数据,分别存储在MongoDB 和PostgreSQL数据库里,新闻数据同步到 ChromaDB向量数据库,以便LLM进行语义搜索。用LangGraph构建了三个代理RAG,新闻数据RAG、股票数据RAG和股票数据图表RAG。
7、CHRONOS
阿里巴巴开源的一个新闻时间线摘要生成系统:CHRONOS,给它一个话题,它能生成一份按时间顺序整理好的重要事件摘要。具备迭代式自我提问机制,可以自己提问,自动找答案,按时间顺序整理重要信息。支持开放域新闻时间线生成,不限特定领域。处理速度快,可以处理大量新闻。
8、OmniThink
浙大和阿里通义实验室开源的一个深度AI写作系统:OmniThink,它模拟人类学习和思考过程,实现了更深入的AI写作,解决了现在AI内容浅显、重复、非原创的问题。OmniThink通过迭代扩展,不断扩充知识边界、持续反思、渐进学习的方式模拟人类学习过程。输出的内容知识密度高,内容冗余少,具备比较强的逻辑性的深度思考能力。支持多种底座模型,可自定义知识来源,可调整生成策略,不过生成质量依赖底座模型质量。
9、WrenAI
一款非常棒的AI数据交互工具:WrenAI,你可以用自然语言提问,它能理解你的意图并生成SQL查询,还能把数据转成图表、表格、报表和BI等,非常适合数据团队。它是一个端到端的解决方案,不只是SQL生成,它提供了从提问到数据可视化、报表生成一套完整流程。支持英语、德语、西班牙语、法语、日语、韩语、葡萄牙语、中文等多语言。支持语义理解,它能理解数据背后的语义和业务逻辑,生成的SQL查询更精准。提供无缝端到端的工作流,你可以输出CSV或JSON格式导入到Excel或Google表格中进一步使用。
AI News
1、杭州投资智谱,加速 GLM 国产大模型技术开源进程
智谱近日宣布完成了一笔金额超过 10 亿元人民币的战略融资,投资方包括杭州城投产业基金和上城资本等。智谱表示,2025 年将是其开源年,届时将发布全新的大模型并将其开源。
2、Wan2GP:为消费级 GPU 优化的视频生成模型
Wan2GP 是一个基于 Wan 2.1 的视频生成模型,旨在为普通消费级 GPU 用户提供强大的视频生成能力。Wan2GP 对原始的 Wan 2.1 模型进行了优化,使其能够在资源有限的设备上运行。它降低了内存和显存(VRAM)的需求,最低可在 8.19GB VRAM 的 GPU 上流畅运行。同样支持文生视频(T2V)、图生视频(I2V)、文生图(T2I),甚至还能给视频配音(V2A),你也可以通过 ComfyUI 调用。
3、字节 Trae 国内首个 AI IDE正式上线
字节发布了Trae 国内版,是国内首个 AI IDE,这款 IDE 使用国产大模型提供智能问答、代码自动补全以及基于 Agent 的 AI 自动编程能力。Trae 支持的模型包括豆包1.5 Pro、满血版 DeepSeek R1 和 DeepSeek V3,目前免费。
4、xAI 的 Grok-3 以 1 分优势超越 GPT4.5 登顶大模型竞技场
lmarena AI 昨天刚刚宣布 GPT4.5 荣登大模型竞技场榜首,结果今天早上 xAI 的 Grok-3-Preview-02-24 就以 1 分的微弱优势超越 GPT4.5-Preview。Grok-3 确实好用,未来大模型的竞争只会更加激烈。
5、MCP 多代理架构实现,快速代理框架浮出水面
MCP多智能体架构实现加速,快速代理框架浮出水面:工程师们正在探索用于多智能体系统的MCP架构,其灵感来自Anthropic研讨会,并构建设备间协作的代理框架。有成员分享了其fast-agent GitHub项目,该项目支持通过定义、提示和测试来创建基于MCP的代理与工作流,允许代理配置独立MCP服务器,并作为工具被其他代理调用。然而MCP Terraform注册表配置存在障碍,特别是在Claude桌面端和Cline环境中,当系统级代理启用时会遭遇mcp-server-fetch错误。
6、飞猪推出 AI 行程助手:在线旅游行业首个融合多模型智能产品
阿里巴巴旗下飞猪3月5日推出在线旅游行业首个多模型融合AI产品——“AI行程助手”,集成DeepSeek-R1推理能力与通义千问自然语言技术,实现秒级生成个性化行程。该工具可处理复杂需求(如“5000元欧洲自驾游”),并计划4月前升级多语言支持及实时数据整合。X平台用户热议其颠覆性潜力,认为多模型协同优势将推动行业智能化转型,携程等竞争对手的AI布局面临新挑战。飞猪此举标志着AI技术在旅游服务场景的深度落地。
7、可灵 AI 正式登陆 Android平台
KLING AI于今日正式推出Android版移动应用,实现iOS与Android双平台覆盖。该应用集成视频生成(Frames)、图像编辑(Elements)等核心AI创作工具,将桌面端专业级功能延伸至移动场景,支持用户随时随地完成视频、图像等内容创作。官方强调此举是“创意民主化”战略的关键一步,旨在降低创作门槛并提升工具便携性。全球用户现可通过应用商店下载,开发者同步优化了移动端交互流程,确保复杂AI功能在手机端的流畅运行,加速创作者从灵感捕捉到作品输出的全链路效率。
8、MiniMax推全新图像生成模型 Image-01,使用成本仅为 1/10
AI公司MiniMax正式推出首款文本到图像生成模型Image-01,通过API服务提供电影级视觉创作能力。该模型基于视频生成技术积累,实现精准提示控制与逻辑一致性,可细腻呈现光影细节、复杂场景及真实人物皮肤纹理,支持16:9至21:9等七种专业纵横比。其批处理功能单次生成9幅图像,最高效率达每分钟90幅,且定价仅为同类产品的10%。MiniMax凭借Hailuo AI Video-01的技术沉淀,将高保真图像生成门槛大幅降低,赋能社交媒体与商业项目的高效创作。
9、百川智能调整 To B 业务,金融团队裁撤聚焦 AI 医疗
AI独角兽百川智能于2025年3月裁撤金融行业B端业务团队,并将提示词工程团队并入产研体系,标志着其战略重心全面转向医疗AI领域。该公司与北京儿童医院联合开发的AI儿科医生已参与疑难病例会诊,成为全球首个正式投入医疗实践的AI医生,并获专家组认证。百川智能表示,此次调整旨在集中资源推进AI医疗技术突破,未来将加速优质医疗资源普惠化进程,通过深度整合算法与临床需求,构建覆盖诊断、会诊全流程的智能医疗系统。
Others
1、中国将推广开源 RISC-V 芯片,推动国内芯片产业发展
中国拟于本月出台首份国家级政策,联合网信办、工信部等八部门推动开源RISC-V芯片架构应用,以降低对x86/Arm的依赖。RISC-V凭借低成本、开源特性,已在阿里玄铁、芯来科技等企业实现商用,并支撑AI企业深度求索的模型高效运行。结合科大讯飞星火大模型的场景优化,中国以“自主芯片+AI生态”应对美国技术封锁,构建从硬件到算法的全链条技术体系,加速半导体与人工智能产业协同突破。
2、朝鲜黑客15亿美元劫案震动币圈,冷钱包神话破灭倒逼行业升级
朝鲜Lazarus黑客组织攻破加密货币交易所Bybit的多重签名冷钱包,窃取价值15亿美元的以太坊及衍生代币,创史上最大金额加密劫案。此次攻击打破冷钱包“绝对安全”认知,黑客通过社会工程攻击侵入授权人员设备,伪造交易信息绕过审批。Bybit被迫动用储备金赔付,用户两日挤兑40亿美元。事件暴露国家级黑客威胁下行业防御短板,倒逼交易所强化安全投入、政府间协作及监管规则重构,美国FBI已介入追踪赃款流向。
3、特朗普加密战略储备计划遭批:政策背书还是利益驱动的市场操纵?
特朗普宣布将比特币、以太坊等加密资产纳入美国数字战略储备,推动市场单日暴涨3000亿美元,但次日其关税政策又引发加密市场暴跌10%。此举被指利用政策为个人及家族利益服务(其家族持有加密银行股份并发行Meme币),且战略储备缺乏合理性——加密资产波动剧烈(比特币一年内价格腰斩)、流动性差,与美元储备地位相悖。分析认为,政府大举购入将变相推高币价,形成“国家队护盘”效应,可能扭曲市场并冲击美元全球信用,遭质疑为利益集团套现铺路。