大模型日报
2024-08-14
大模型资讯
-
摘要: 一种类似于ChatGPT的大型语言模型被用于开发一种改良版的杀菌药物,将原本有毒的抗生素转变为救命药物,展现了人工智能在医疗领域的巨大潜力。
-
摘要: AMD宣布已完成对欧洲最大私人AI实验室Silo AI的全现金收购,此举旨在提升其硬件上的AI模型开发能力。
-
摘要: 技术创新研究院(TII)推出了Falcon Mamba 7B,这是一种采用状态空间语言模型的大型开源语言模型。
-
摘要: rStar是一种无需微调即可在推理过程中提升小型语言模型推理能力的新型AI方法。虽然大型语言模型在各类应用中取得了显著进展,但它们仍面临诸多挑战。
-
摘要: 根据达姆施塔特工业大学的一项新研究,像ChatGPT这样的AI模型在独立学习方面的能力似乎较弱,可能主要依赖于上下文学习。
-
摘要: 最新研究显示,大型语言模型(如ChatGPT)无法自主学习或在没有明确指导的情况下获得新技能。因此,这些AI技术不对人类构成生存威胁。
-
摘要: 牛津互联网研究所的领先监管和伦理专家指出,大型语言模型(LLMs)带来了新的危害类型,呼吁对其进行更严格的监管,以防范其对社会可能造成的风险。
-
摘要: 苹果研究人员发布了KGLens,这是一种专门用于可视化和评估大型语言模型(LLMs)中嵌入的事实知识的新型AI方法。尽管LLMs因其多功能性受到广泛关注,但其事实性仍是一个关键问题。
-
摘要: 伦敦消息,2024年8月13日,一项新的研究表明,ChatGPT等大型语言模型(LLMs)没有独立学习或自我发展的能力,因此不构成生存风险。
-
摘要: 博思艾伦汉密尔顿公司在太空站部署了首个生成式人工智能大语言模型,旨在帮助宇航员解决问题并回答查询。
大模型产品
大模型论文
-
摘要: MovieSum是一个新的电影剧本抽象摘要数据集,包含2200部电影剧本及其维基百科情节摘要,并提供IMDb元数据。
-
摘要: 本文探讨大语言模型(LLMs)在处理生命性概念时是否具备类似人类的能力,结果显示LLMs在典型情境下表现出类人行为。
-
摘要: VisualAgentBench是一个专为训练和评估大规模多模态模型设计的全面基准,涵盖多种场景,促进模型性能提升。
-
摘要: 本文研究了LLM在旅行规划任务中的表现,发现其在处理长上下文和反馈方面存在不足,并提出了反馈感知微调方法。
-
摘要: AI科学家框架实现自动科研,生成创意、编程、实验、写作和评审,推动机器学习领域的创新和发展。
-
摘要: EXP3RT通过利用用户和物品评论中的丰富偏好信息,提升推荐系统的评分预测准确性,并提供合理解释。
-
摘要: FuxiTranyu-8B是一个开源多语言大模型,覆盖43种自然语言和16种编程语言,性能优于现有多语言模型。
-
摘要: 本文介绍了首个基于RAG技术的问答模型,帮助网络安全专家进行网络攻击调查和归因,优于GPT模型。
-
摘要: 本文提出CLAIR数据创建方法和APO对齐目标,通过对比学习和更稳定的对齐控制,提高LLM的对齐效果。
-
摘要: 研究RMU在中间层遗忘效果,提出自适应RMU方法,提高遗忘性能并抵御对抗攻击,实验验证其有效性。
大模型开源项目
-
摘要: Hacksider是一个基于Python的项目,支持仅用一张图片进行实时换脸和一键视频深度伪造。
-
摘要: Ostris项目包含各种AI脚本,主要涉及Stable Diffusion技术,使用Python语言编写,适合AI开发者参考。
-
摘要: LLaVA-VL是一个用Python编写的AI项目,目前没有详细描述,可能涉及视觉和语言处理。
-
摘要: suno-ai项目是一个基于文本提示的生成音频模型,使用Jupyter Notebook编写,能够根据文本生成音频内容。
本文由 mdnice 多平台发布