大模型日报
2024-07-20
大模型资讯
-
摘要: MUSE是一个综合性的AI框架,用于评估语言模型中的机器遗忘。由于语言模型在大量文本上进行训练,面临隐私和版权问题,MUSE框架旨在解决这些挑战。
-
摘要: OpenAI发布了新的GPT-4o Mini大型语言模型,旨在提供更紧凑但强大的AI功能。该模型已被添加到ChatGPT及其API中,标志着GPT-3.5的替代升级。
-
摘要: 尽管当前领先的AI聊天机器人在语言技能方面表现出色,但在推理方面仍存在困难。OpenAI正在进行一个名为Strawberry的秘密项目,旨在开发具备推理和深度研究能力的AI。
-
摘要: Meta公司发布了一款AI模型,能够翻译和转录数十种语言的语音。这款新模型由Facebook母公司Meta Platforms推出,旨在提升跨语言沟通的效率和准确性。
-
摘要: 谷歌AI发布了一篇关于FLAMe的论文,这是一种基础大型自动评估模型,旨在为复杂多样的大型语言模型提供可靠且高效的评估方法。
-
摘要: OpenAI发布了针对应用开发者的GPT-4o mini模型,取代了旧版的GPT-3.5模型。该模型现已在OpenAI的ChatGPT平台上推出,适用于Plus和Team订阅用户以及免费用户。
-
摘要: 奥克兰大学的研究人员推出了ChatLogic,这项技术在复杂任务中的准确率提升了50%以上。大语言模型在内容生成和解决复杂问题方面展示了非凡的能力,而ChatLogic进一步增强了其多步骤推理能力。
-
摘要: EM-LLM是一种将人类情节记忆和事件认知关键方面整合到基于Transformer的语言模型中的新型灵活架构。尽管大型语言模型的能力不断扩展,但它们在处理大范围上下文时仍存在问题。
-
摘要: 高效量化感知训练(EfficientQAT)是一种新型机器学习量化技术,旨在压缩大语言模型(LLMs)。随着LLMs在各种AI任务中的应用增多,其庞大的参数规模导致内存需求和带宽增加。
-
摘要: PolygloToxicityPrompts数据集包含17种语言的42.5万个自然生成的提示,涵盖不同程度的毒性。互联网低质量数据的增长导致大语言模型中不良、危险或有害知识的传播。
大模型产品
-
摘要: GPT-4o mini在MMLU测试中得分82%,聊天偏好优于GPT-4,价格比GPT-3.5 Turbo低60%以上。
-
摘要: 整合并编排多个数据源,提供统一API。连接任意数据流,创建数百个应用集成,加速开发和上市时间。
-
摘要: Xspiral是一款在线3D可视化工具,结合2D/3D设计、实时协作和AI,帮助用户轻松创建3D作品。
-
摘要: Cohesive AI在Google Sheets中实现AI数据增强、网页抓取及邮件验证,助力数据分析与个性化营销。
-
摘要: 使用Flot AI记忆,轻松构建个人知识库,随时随地通过与AI聊天记住和回忆关键信息。
-
摘要: AnyParser为金融服务提供精准的PDF和图像文档解析,将文本、表格和图表映射到数据库,确保隐私与企业集成。
-
摘要: 使用AI过滤器、全天候运行、多语言支持和无限消息处理,革新社区管理。灵活低价方案每月仅$5起。
-
摘要: AnotherWrapper提供AI初创工具包,让你在数小时内构建并发布AI应用,轻松实现创意并盈利。
-
摘要: InfinipilotAI提升macOS生产力,提供AI自动补全、语法修正、翻译等功能,支持本地隐私保护,适合开发者和多语言用户。
-
摘要: Wasps是一个IDE内的AI代码审查工具,提供上下文相关的反馈,提升开发效率,享受更愉快的编程体验。
大模型论文
-
摘要: 本文探讨了多图像视觉问答任务,提出了新基准“视觉干草堆”,并引入了MIRAGE框架,有效提升了检索与问答性能。
-
摘要: SegPoint利用多模态LLM实现多任务点云分割,包括3D指令、指示、语义及开放词汇分割,并在Instruct3D数据集上表现优异。
-
摘要: 本文揭示了检索增强生成模型在面对黑箱攻击时的脆弱性,实验显示攻击策略显著改变生成内容的意见极性,影响用户认知与决策。
-
摘要: CellularLint利用自然语言处理和少样本学习,检测4G/5G协议中的不一致性,发现157处问题,准确率82.67%。
-
摘要: 研究开发了一个基于游戏Baba Is You的新基准,测试了三种多模态大型语言模型,发现它们在需要操控和组合游戏规则时表现不佳。
-
摘要: CoDefeater通过自动化过程利用大型语言模型(LLMs)发现保障案例中的反驳证据,初步结果显示LLMs能有效支持安全分析。
-
摘要: 本文探讨了直接偏好优化(DPO)对参考策略的依赖性,发现参考策略的强度和相似性对DPO效果有显著影响。
-
摘要: 本文综述了2017至2024年推荐系统的发展,从传统方法到深度学习等先进技术,涵盖电商、医疗等领域的挑战和应用。
-
摘要: 研究表明,通过Prover-Verifier游戏训练算法,提升了大语言模型在解决数学问题时的输出可读性和人类验证准确率。
-
摘要: DART-Math通过难度感知拒绝调优,生成更高效的数学问题解决数据集,显著提升模型性能,无需依赖专有模型。
大模型开源项目
-
摘要: mem0ai是一个用Python编写的项目,旨在为个性化AI提供记忆层,以增强AI的个性化能力。
-
摘要: hiyouga项目提供一个基于Python的Web界面,用于高效微调超过100种大语言模型,适用于ACL 2024。
本文由 mdnice 多平台发布