【AI News | 20250321】每日AI进展

AI Repos

1、gurubase
开源AI问答助手工具,支持网页、PDF、视频及GitHub仓库作为知识源,已被数百个开源项目采用。用户可快速构建专业问答助手,并嵌入网站或集成Slack、Discord,支持实时数据更新。通过简单安装脚本即可本地部署,方便开发者使用。
在这里插入图片描述

2、all-rag-techniques
是一份详尽的检索增强生成(RAG)技术教程,涵盖20+种技术,从基础RAG到语义分块、查询转换、重排序、图形RAG等高级方法。使用基础Python库实现,不依赖LangChain或FAISS,配有Jupyter笔记,提供技术解释、步骤与代码示例。适合开发者与研究人员深入学习RAG工作原理,推动AI应用创新。
在这里插入图片描述

3、fetcher-mcp
Fetcher-MCP是一款基于Playwright无头浏览器的网页内容抓取MCP服务器,支持JavaScript执行,能处理动态网页与现代应用。内置Readability算法,自动提取主要内容,去除广告、导航等非核心元素。支持并行处理,提供HTML和Markdown输出格式,并可屏蔽图片、样式表等不必要资源以优化性能。此工具适用于高效抓取网页内容,已在GitHub开源,助力开发者与大模型集成,提升自动化浏览体验。
在这里插入图片描述

AI News

1、李飞飞团队推出FlowMo,革新图像处理技术
斯坦福大学李飞飞和吴佳俊团队发布“FlowMo”,一种新型图像tokenizer,突破传统卷积网络与对抗学习的局限。FlowMo采用两阶段训练,先捕捉多样化重建结果,再优化至接近原图,提升图像质量与感知效果。在ImageNet-1K等数据集上,FlowMo以低比特率FID值0.95超越现有最佳模型。此技术为图像生成与处理开辟新路径,助力视觉应用更高效智能。

2、富途接入DeepSeek-R1,升级AI投资功能亮相投资展
富途证券在3月21日“富途投资展”上宣布接入DeepSeek-R1,推出升级AI产品功能。牛牛AI变身智能助手,处理复杂查询,助新手快速分析股票,未来可筛选投资目标。新功能包括“机会”智选页面、期权策略及AI程序交易,降低量化交易门槛。创始人李华强调结合自有数据训练AI,确保信息真实性。2024年Q4财报显示营收44.33亿港元,同比增长86.8%,用户达2515万,增长16%。富途持续推进国际化战略。

3、维他动力获2亿元种子轮融资,年底推智能家居机器人
维他动力(Vita Dynamics)完成2亿元种子轮融资,由今日资本、凯辉基金领投,雅瑞资本等跟投。这家成立仅三月的初创公司专注智能生活机器人,首款具备自主移动能力的伴随机器人预计年底亮相,适用于室内外场景。创始人余轶南博士表示,资金将用于研发、团队扩展及供应链建设,旨在提升生活质量,让智能家居更普惠。借助中国成熟的智能制造链与AI人才优势,维他动力欲乘机器人产业东风,带来生活新便利。

4、英伟达拟投数千亿推动美国半导体供应链发展
英伟达宣布未来四年将在美国供应链投资约5000亿美元,响应“美国优先”政策,推动本土半导体发展。CEO黄仁勋在GTC 2025大会上表示,已通过台积电等供应商实现美国生产,同时对华为AI芯片崛起及制裁效果表达担忧,否认与英特尔合作传闻。台积电追加1000亿美元投资亚利桑那州设施,强化美国制造。此举与苹果等巨头举措一致,旨在提升供应链韧性与AI技术竞争力。

5、钉钉发布“AI创新N次方计划”,全方位助力AI创业
钉钉在“AI创业N次方”大会上推出新生态政策“AI创新N次方计划”,免除佣金、保证金及算力费用,并提供销售、品牌、技术、投资支持,降低AI创业门槛。副总裁王铭强调聚焦生态合作,已覆盖15个软件类目、4700场景、346行业,220万企业使用AI。政策包括流量推广、技术指导等,还发布《AI创业行动指南》。与销帮帮、恩君特合作推出“AI销售助理”和“AI短视频助理”,效率提升显著。钉钉将深化合作,助推AI应用与企业转型。

6、LexisNexis推出AI助手Protégé,小模型赋能法律行业
LexisNexis推出AI助手Protégé,助力法律专业人士撰写、校对文件并确保引用准确,强调个性化与工作流学习。结合Anthropic、Mistral及OpenAI等多模型技术,通过蒸馏小型模型提升性能与成本效益。主要依赖微调Mistral模型,计划融入Claude及Gemini模型。Protégé支持文档起草、工作流建议、问题生成及文档总结,旨在成为智能化法律助手。首席技术官Jeff Riehl称,多模型策略优化任务分解与响应速度,标志法律工作智能化的新尝试。

7、蚂蚁集团收购好大夫后推AI辅助系列,服务29万医生
蚂蚁集团加速AI医疗布局,3月21日发布升级AI产品体系:联合华为、阿里云推出“蚂蚁医疗大模型一体机”,实现一键私有化部署,已覆盖7家机构;面向好大夫在线29万医生,推出AI医生助手系列,包括“AI科研助手”,提升医教研效率;“AI健康管家”新增智能思考、健康自测等功能,服务近4000万用户。蚂蚁以医疗大模型为核心,构建“机构-医生-患者”三维体系,打通诊疗到健康管理闭环,探索安全可信AI应用。

8、Roblox推出AI驱动Cube工具,开启游戏创作新篇章
Roblox发布AI驱动的3D智能模型Cube,助力开发者高效设计游戏资产。通过简单指令,Cube可生成3D物体、场景及角色造型,简化创作流程。CEO大卫・巴祖基称其为协作助手,未来将支持完整场景与互动逻辑设计。模型采用3D形状token化与新型位置编码技术,确保高保真度输出。尽管复杂请求表现待优化,Cube仍标志着Roblox迈向3D智能创作的关键一步,开辟游戏开发新纪元。

9、前字节AI专家解浚源加盟千寻智能,领军具身智能研发
前字节跳动AI专家解浚源加入千寻智能,出任具身智能部负责人。他毕业于中科大并获华盛顿大学博士学位,曾是MXNet开源项目创始人之一,在亚马逊和字节积累深厚经验。千寻智能专注AI与机器人全栈技术,CEO韩峰涛领军下已取得进展。解浚源的加盟将加速具身大模型研发,强化千寻在全球具身智能赛道的竞争力,助推技术落地与创新。

10、天猫“家作”AI设计助手亮相AWE,助力商家效率飞跃
天猫在2025上海AWE展推出AI设计工具“家作”,为家电家居商家提供高效解决方案。商家上传商品图即可生成80+风格场景图,AI模特功能模拟真人效果逼真,节省设计成本。如慕思一年生成近2000张图,省140万元。目前超13万商家使用,包括源氏木语等品牌。设计流程从2-3天缩至几分钟。天猫还推出AI直播、营销、智能客服等工具,全面提升效率,并展示AI冰箱等产品及虚拟家居体验舱,引领AI购物新趋势。

11、字节推出InfiniteYou:保留人脸特征,场景随意切换
字节跳动发布文本到图像生成模型InfiniteYou(InfU),通过InfuseNet将身份特征注入FLUX等DiT模型,结合多阶段训练提升文图对齐与图像质量。提供aes_stage2(美观优先)和sim_stage1(相似度优先)两版本,超越FLUX.1-dev IP-Adapter和PuLID-FLUX。其“即插即用”设计兼容FLUX变体、ControlNets和LoRAs,支持风格迁移。目前开源供学术研究,需遵守CC BY-NC 4.0许可及相关法规,旨在推动高质量身份保留图像生成。

12、腾讯元宝新增功能,支持分析复杂Excel表格
腾讯元宝推出新功能,支持分析复杂Excel表格,用户只需用自然语言提问,即可获数据读取、计算及重点标注,免去繁琐公式操作。表格可本地上传或从微信、腾讯文档导入,兼容多端使用。切换至混元Turbo S模型并关闭深度思考,还能通过代码快速处理大型表格。此升级简化操作、提升效率,降低Excel使用门槛,让数据分析更便捷。

13、快手搜索AI升级:接入DeepSeek R1,体验质变
快手宣布搜索功能全面接入DeepSeek R1大模型,提升搜索效果与用户体验,旨在增加活跃度并探索商业化潜力。此前,其“可灵AI”已整合DeepSeek R1,优化视频与图片生成,用户可通过精准提示词控制场景、镜头等元素,简化创作流程。快手通过AI技术升级,不仅增强核心搜索,还提升内容生成工具性能,标志着其在技术驱动平台优化上的重要进展。

14、Midjourney核心开发者theseriousadult转投Cursor研发AI编程Agents
Midjourney核心开发者theseriousadult宣布离职,其领导V2至V7模型开发,以美学与创意著称。在X上,他透露已加入Cursor,专注AI编程Agents研发,旨在提升编程效率与自动化。他表示对Cursor长期使用并看好其潜力。业内对这一变动褒贬不一,有人惋惜Midjourney损失人才,有人期待其在新岗位的突破。虽离职原因未明,此事件凸显AI行业人才流动新动态。

15、阿里云携手亚洲十所高校及机构,共育AI与云计算人才
阿里云与新加坡国立大学、泰国数字经济促进局等10所亚洲高校及机构合作,推出AI与云计算培训课程,覆盖七个国家和地区。在新加坡共建Skills Center提供前沿培训,泰国则推泰语版学习平台并纳入认证体系。阿里云还启动“AI赋能ESG计划”,提升治理报告效率。自去年起,已与全球110所高校合作,培训超53万人。此次合作深化亚洲数字人才培养战略,助力区域数字经济发展。

16、Reka开源Reka Flash 3,谷歌前科学家打造超Gemma 3 27B模型
Reka AI,由谷歌DeepMind前科学家创立,发布首个开源模型Reka Flash 3。这款21B参数推理模型从零训练,经监督微调与RLOO优化,性能超越Command A与Gemma 3 27B,成同规模佼佼者。支持强推理、低延迟、设备部署,驱动Nexus平台AI工作者,具备“思考”机制与预算控制。虽非知识密集型首选,结合搜索工具可扩展能力。模型已开源,助力开发者创新。

17、全球首款儿科大模型“福棠・百川”发布,升级儿童医疗服务
百川智能联合北京儿童医院及小儿方健康推出全球首款儿科大模型“福棠・百川”,覆盖儿童常见及疑难病症,具备强大临床推理能力。其首创“循证模式”整合医学证据,提升诊疗质量。提供“AI儿科医生”专家版与基层版,结合医联体覆盖基层医院。模型基于万亿级医疗数据及300多位专家经验,强化循证与多模态能力,配以4万+指南、3800万+论文的知识库,助力精准诊疗与基层医疗升级。

18、老板电器“食神”AI烹饪模型亮相AWE,开启智能厨房时代
老板电器在上海AWE展发布首款AI烹饪大模型“食神”,融合2TB知识库与46年经验,提供个性化菜谱、健康膳食规划及文化故事讲解。支持面部识别、体检分析,用户可通过智能设备实现全自动烹饪,如自动火力调节与翻炒。副总裁周海昕强调其提升饮食乐趣与生活质量。“食神”无缝连接老板全系列产品,覆盖烹饪全流程,未来有望让每位用户轻松享受智能厨房体验。

19、AMD以智能高效计算推动AI成功
AMD强调通过智能、高效的计算资源应对AI需求增长,帮助企业突破瓶颈。现代化数据中心升级,如用AMD EPYC处理器替换旧Xeon,可节省68%能耗、减少87%服务器使用。AMD Instinct MI325X GPU和EPYC CPU分别以优异推理性能和高核心密度支持AI工作负载。ROCm开源软件栈增强灵活性,适应多规模模型需求。企业需评估基础设施,逐步升级以降低成本,AMD的硬件软件组合助力AI创新与扩展。

20、Claude新增网络搜索功能,提供实时信息与来源引用
Anthropic为Claude推出网络搜索功能,将搜索结果转化为对话式回答并标注来源,类似Perplexity与ChatGPT。目前仅限美国付费用户使用Claude 3.7 Sonnet模型,未来将扩展至更多国家和免费用户。AI助手功能趋同,竞争聚焦模型性能与提示易用性,未来优势或在于灵活模型选择。然而,聊天机器人搜索可能减少网站流量高达96%,影响内容创作者收入。Anthropic未与媒体公司达成内容授权协议,与竞争对手形成对比。

21、OpenAI发布gpt-4o-transcribe,语音转录准确率大幅提升
OpenAI推出三款新语音模型,其中gpt-4o-transcribe以超低2.46%的英语错误率领衔,超越Whisper,支持100+语言。集成噪声消除与语义检测技术,它在嘈杂环境、多种口音及语速下表现卓越,已通过API开放给开发者,定价每分钟$0.006。虽暂不支持说话人分离,仍适用于呼叫中心、会议记录等场景。竞品如ElevenLabs Scribe提供类似价格与额外功能,市场竞争加剧。OpenAI未来或将技术整合至ChatGPT,助力语音AI应用发展。

22、腾讯发布混元T1正式版,推理速度快且价格亲民
腾讯推出自研深度思考模型混元T1正式版,性能对标DeepSeek R1和OpenAI o1,采用创新Hybrid-Mamba-Transformer架构。该架构降低计算复杂度和KV Cache占用,提升超长文本处理能力,首创无损应用于超大型推理模型。T1推理速度极快,支持秒回与快速输出,已在腾讯云上线,API定价为输入1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值