2024-WK34-前沿技术动态

本周前沿技术动态以AI领域为主。

1、企业战略

快手:坚定执行AI战略,“可灵AI”力争尽快实现可观的商业化变现

在快手业绩电话会上,快手联合创始人、董事长兼CEO程一笑介绍,快手已在AI领域展开全面布局,目前快手已经构建了一套支持万亿参数大模型训练和推理的基础设施,并基于此,先后研发了快意语言大模型、视觉生成大模型和推荐大模型。

程一笑表示,未来快手将坚定执行AI战略,进一步升级可灵大模型。针对可灵AI的商业化,除了加强C端会员付费的全球运营外,也将寻求更多与B端合作变现的可能性,力争尽快实现可观的商业化变现规模。



2、关于OpenAI

OpenAI 正式推出 GPT-4o 微调服务!每日附赠百万训练token

1. OpenAI推出GPT-4o微调服务,允许开发者使用自定义数据集进行微调,以提高特定应用场景中的性能和成本效率;

2. GPT-4o微调服务的费用结构包括训练费用和推理费用,同时提供免费训练tokens的优惠期;

3. 微调后的GPT-4o模型在多个行业基准测试中表现出色,如软件工程和SQL查询生成,显示了其在特定领域应用的潜力和企业级解决方案的实际价值。

更多:https://mp.weixin.qq.com/s/3L22Y4sF_Qz4Z7yXk4l0sw



3、物流场景

顺丰物流决策大模型“丰知”发布

在AICon 2024全球人工智能开发与应用大会上,顺丰科技推出了自主研发的“丰知”物流决策大模型,该模型旨在将大模型技术应用于物流供应链的智能化分析、销量预测、运输路线优化与包装优化等决策领域。此外,顺丰科技还与包括零一万物在内的多家大模型创业公司达成生态合作,将在大模型领域展开进一步动作和布局。



4、语音模型

字节跳动推出Seed-ASR语音模型,能识别转录多语言和方言

1. Seed-ASR支持多语言和方言,能识别13种中国方言和7种外语,并计划扩展更多语言;

2. 采用数十亿参数的模型,结合音频编码器和大语言模型实现上下文感知的语音识别;

3. 通过自监督学习、监督微调、上下文微调和强化学习的训练过程,提高了长文本处理能力和专业领域的表现。

更多:https://mp.weixin.qq.com/s/8K0VTh_doOeV2mOifCJhnQ



5、训练数据

合成数据:微软团队开发的AgentInstruct智能体框架自动创建合成数据,通过生成式教学方法减少模型幻觉

1. 微软团队开发的AgentInstruct智能体框架能自动创建大量多样化的合成数据,用于模型训练;

2. 使用AgentInstruct后训练的Orca-3模型在多个基准测试中性能显著提升,特别是在数学方面提高了168%;

3. AgentInstruct通过生成式教学方法,减少了模型幻觉,提高了数据生成的质量和多样性。

更多:https://mp.weixin.qq.com/s/lLfMgsRtYRfONL4PPxvEoA



爬虫数据:Meta推出全新网络爬虫程序以训练AI模型

Meta推出全新网络爬虫程序Meta-External Agent和Meta-External Fetcher,用于收集互联网数据以训练其AI模型,该程序可绕过robots.txt规则,从而无限制地获取数据。



6、大模型+操作系统

中国首个接入大模型的Linux开源操作系统正式发布!

1. deepin V23是首个集成AI的中国开源Linux操作系统,支持多模态输入和智能助手功能;

2. 系统支持多种国内外CPU和GPU,及90%主流AI模型和框架,允许自定义模型适配;

3. deepin V23包含200多项产品优化,如原子更新和独立软件包工具,提高系统性能和用户体验。

更多:https://mp.weixin.qq.com/s/9t7agKVtj56jduL4uJF4jA



7、技术创新

UBC研究团队提出ADAS系统,允许AI自动设计和优化新的智能体

1. ADAS系统由UBC研究团队提出,允许AI自动设计和优化新的智能体,通过元智能体搜索算法实现;

2. ADAS通过搜索算法和评估函数,探索和优化智能体设计,实现自我进化和性能提升;

3. 实验结果显示,ADAS设计的智能体在多个领域的性能优于现有人工设计的智能体,特别是在数学能力上提升了25.9%。

更多:https://mp.weixin.qq.com/s/IjNLHLov8UyAiRGDkf_XTA



8、开源

给RAG系统全面「体检」,亚马逊开源RAGChecker诊断工具

1. 亚马逊开源了RAGChecker,一个细粒度和全面诊断工具,专为评估和优化RAG系统设计;

2. RAGChecker提供多维度评估指标,如忠实度、上下文利用率、噪声敏感度,以及幻觉,确保评估的深度和广度;

3. 工具经验证具有与人类判断高度相关的评估结果,支持开发者通过具体指标优化RAG系统性能。

更多:https://mp.weixin.qq.com/s/x4o7BinnwvTsOa2_hegcrQ



英伟达开源新大模型:训练数据减少40倍,算力节省1.8倍

1. 英伟达开源新大模型Nemotron-4-Minitron,通过结构化剪枝和知识蒸馏技术,大幅降低训练数据需求和算力消耗;

2. 新模型训练数据需求减少40倍,算力节省1.8倍,性能与其他大模型媲美;

3. 结构化剪枝优化模型在现代硬件上的运行效率,知识蒸馏帮助模型在少量数据上迅速学习和提高性能。

更多:https://mp.weixin.qq.com/s/BaM1DJ5f1NOSeEE99QvBCA

  • 8
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值