人工智能
文章平均质量分 88
人工智能技术分享
人工智能技术派
这个作者很懒,什么都没留下…
展开
-
Whisper-AT:一个统一语音识别和音频标签的模型
一种语音大模型优化技术:在Whisper基础上添加轻量级的音频标签模型,在额外增加计算成本小于1%的情况下,同时输出识别结果和音频标签原创 2024-03-21 14:42:57 · 1449 阅读 · 0 评论 -
TinyStories如何四两拨千斤?
一种模型优化技术:论文以用小模型生成英语故事为切入点,探讨大模型在垂直领域落地的一种可行方案原创 2024-03-19 22:36:58 · 936 阅读 · 0 评论 -
Claude3——给奥特曼一点点压力!
微信公众号|人工智能技术派作 者|hwsClaude系列模型是由美国创业公司Anthropic基于transformer架构研发,该公司是一群在2021年OpenAI离职员工(包括前首席科学家Ilya Sutskever和Dario Amodei)创建的。Anthropic先前已发布Claude1和Claude2,效果相当不错模,紧追OpenAI。过去短短半年,Claude3效果已优于GPT-4,从跟随者变为引领者。下面将简要介绍一下本次发布的Claude3特点。原创 2024-03-09 18:29:13 · 998 阅读 · 0 评论 -
CoT-Decoding
大模型推理,prompt会在很大程度上影响结果准确性,因此很多公司专门设置"prompt工程师"这个职位,显然就像先前NLU写规则一样,获取适合任务的prompt也渐渐成为一个非常耗费人力的方向,那么是否可以在保证精度的情况下,跳过编写prompt这个流程?从实现方案及效果来看,该技术方案离“不需要任何显式的CoT prompting”还有一定距离。计算量增加:从Figure-3可以看出,通常topk越大效果越好,但与之相应的是计算量也会增加。原创 2024-03-09 18:35:34 · 1002 阅读 · 0 评论