大模型日报 2024-08-14

大模型日报

2024-08-14

大模型资讯

  1. AI将毒性抗生素转化为救命药物
  • 摘要: 一种类似于ChatGPT的大型语言模型被用于开发一种改良版的杀菌药物,将原本有毒的抗生素转变为救命药物,展现了人工智能在医疗领域的巨大潜力。
  1. AMD收购欧洲最大私人AI实验室Silo AI
  • 摘要: AMD宣布已完成对欧洲最大私人AI实验室Silo AI的全现金收购,此举旨在提升其硬件上的AI模型开发能力。
  1. TII发布新型开源语言模型Falcon Mamba 7B
  • 摘要: 技术创新研究院(TII)推出了Falcon Mamba 7B,这是一种采用状态空间语言模型的大型开源语言模型。
  1. rStar:一种提升小型语言模型推理能力的新型AI方法
  • 摘要: rStar是一种无需微调即可在推理过程中提升小型语言模型推理能力的新型AI方法。虽然大型语言模型在各类应用中取得了显著进展,但它们仍面临诸多挑战。
  1. 大型语言模型的突现能力是否仅是上下文学习?
  • 摘要: 根据达姆施塔特工业大学的一项新研究,像ChatGPT这样的AI模型在独立学习方面的能力似乎较弱,可能主要依赖于上下文学习。
  1. 研究表明:AI无法自主学习,不构成生存威胁
  • 摘要: 最新研究显示,大型语言模型(如ChatGPT)无法自主学习或在没有明确指导的情况下获得新技能。因此,这些AI技术不对人类构成生存威胁。
  1. 研究人员称大型语言模型对社会构成风险,需加强监管
  • 摘要: 牛津互联网研究所的领先监管和伦理专家指出,大型语言模型(LLMs)带来了新的危害类型,呼吁对其进行更严格的监管,以防范其对社会可能造成的风险。
  1. 苹果研究人员推出KGLens:用于可视化和评估LLMs事实性的新型AI方法
  • 摘要: 苹果研究人员发布了KGLens,这是一种专门用于可视化和评估大型语言模型(LLMs)中嵌入的事实知识的新型AI方法。尽管LLMs因其多功能性受到广泛关注,但其事实性仍是一个关键问题。
  1. 新研究证实大型语言模型不构成生存风险
  • 摘要: 伦敦消息,2024年8月13日,一项新的研究表明,ChatGPT等大型语言模型(LLMs)没有独立学习或自我发展的能力,因此不构成生存风险。
  1. 博思艾伦汉密尔顿在太空部署首个人工智能大语言模型
  • 摘要: 博思艾伦汉密尔顿公司在太空站部署了首个生成式人工智能大语言模型,旨在帮助宇航员解决问题并回答查询。

大模型产品

大模型论文

  1. MovieSum: 电影剧本摘要数据集
  • 摘要: MovieSum是一个新的电影剧本抽象摘要数据集,包含2200部电影剧本及其维基百科情节摘要,并提供IMDb元数据。
  1. 大语言模型能否像人类一样理解生命性?
  • 摘要: 本文探讨大语言模型(LLMs)在处理生命性概念时是否具备类似人类的能力,结果显示LLMs在典型情境下表现出类人行为。
  1. VisualAgentBench:大规模多模态模型基准
  • 摘要: VisualAgentBench是一个专为训练和评估大规模多模态模型设计的全面基准,涵盖多种场景,促进模型性能提升。
  1. 基于LLM的长远规划能力研究
  • 摘要: 本文研究了LLM在旅行规划任务中的表现,发现其在处理长上下文和反馈方面存在不足,并提出了反馈感知微调方法。
  1. AI科学家:自动化开放式科学发现
  • 摘要: AI科学家框架实现自动科研,生成创意、编程、实验、写作和评审,推动机器学习领域的创新和发展。
  1. 基于LLM的个性化偏好推理推荐系统
  • 摘要: EXP3RT通过利用用户和物品评论中的丰富偏好信息,提升推荐系统的评分预测准确性,并提供合理解释。
  1. FuxiTranyu:平衡数据训练的多语言模型
  • 摘要: FuxiTranyu-8B是一个开源多语言大模型,覆盖43种自然语言和16种编程语言,性能优于现有多语言模型。
  1. 基于RAG的网络攻击调查问答模型
  • 摘要: 本文介绍了首个基于RAG技术的问答模型,帮助网络安全专家进行网络攻击调查和归因,优于GPT模型。
  1. 锚定偏好优化与对比修订:解决对齐中的不确定性
  • 摘要: 本文提出CLAIR数据创建方法和APO对齐目标,通过对比学习和更稳定的对齐控制,提高LLM的对齐效果。
  1. 自适应RMU在大语言模型遗忘中的应用
  • 摘要: 研究RMU在中间层遗忘效果,提出自适应RMU方法,提高遗忘性能并抵御对抗攻击,实验验证其有效性。

大模型开源项目

  1. Hacksider: 实时换脸与视频换脸
  • 摘要: Hacksider是一个基于Python的项目,支持仅用一张图片进行实时换脸和一键视频深度伪造。
  1. Ostris:AI脚本集合
  • 摘要: Ostris项目包含各种AI脚本,主要涉及Stable Diffusion技术,使用Python语言编写,适合AI开发者参考。
  1. LLaVA-VL: Python语言的AI项目
  • 摘要: LLaVA-VL是一个用Python编写的AI项目,目前没有详细描述,可能涉及视觉和语言处理。
  1. 文本提示生成音频模型
  • 摘要: suno-ai项目是一个基于文本提示的生成音频模型,使用Jupyter Notebook编写,能够根据文本生成音频内容。

本文由 mdnice 多平台发布

  • 14
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值