大模型日报 2024-07-29

赛博 AI

于 2024-07-29 17:53:21 发布

阅读量216

点赞数 4

文章标签：程序人生

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40262196/article/details/140777331

版权

大模型日报

2024-07-29

大模型资讯

Meta推出Llama 3基础语言模型群

摘要: Meta在新德里发布了Llama 3基础语言模型群，这是Meta迄今为止推出的最大模型。

DeepL推出改进版AI，提升33种语言翻译质量

摘要: DeepL推出了改进版的人工智能技术，提高了对33种语言的翻译质量。与其他大型语言模型不同，DeepL的新技术在翻译准确性和自然度上有显著提升。

Meta发布全球最大最强开源AI模型Llama 3.1

摘要: Meta宣布其最新的开源AI模型Llama 3.1成为全球最大和最强的模型。该技术巨头表示，这一新模型在性能和能力上都达到了新的高度，展示了Meta在人工智能领域的领先地位。

斯坦福研究人员推出对比偏好学习(CPL): 一种用于RLHF的新机器学习框架

摘要: 斯坦福研究人员提出了一种名为对比偏好学习(CPL)的新机器学习框架，使用遗憾偏好模型来解决AI研究中对齐模型与人类偏好的挑战，特别是在高维和序列任务中。

IBM研究人员提出新方法减少大模型幻觉现象

摘要: IBM研究人员提出了一种无需训练的新型AI方法，以减少大型语言模型（LLMs）在机器翻译、摘要和内容创作等应用中的幻觉现象。

通过将系统2推理转化为高效系统1响应优化人工智能性能

摘要: 大型语言模型（LLMs）可以通过增加计算能力来生成中间思考，从而改进最终答案。这种方法通过将系统2的深度推理转化为系统1的快速响应，实现了人工智能性能的优化。

CompeteAI: 理解大语言模型代理竞争动态的AI框架

摘要: CompeteAI 是一个人工智能框架，专注于理解基于大语言模型的代理之间的竞争动态。该框架旨在分析和优化这些代理在不同竞争环境中的表现。

AI模型训练数据越来越依赖合成数据

摘要: 随着AI技术的发展，越来越多的AI模型训练数据来自其他AI模型生成的合成数据。这些合成数据可以填补聊天机器人知识的空白，提升其性能和准确性。

智谱AI发布AI驱动的视频生成器青影，挑战OpenAI的Sora

摘要: 北京大型语言模型初创公司智谱AI于周五推出了其人工智能驱动的视频生成器青影，旨在与OpenAI的Sora竞争。

Elon Musk的xAI即将发布Grok 2语言模型

摘要: Elon Musk的xAI公司即将发布下一代Grok 2语言模型，该模型包括使用指南、发布日期和功能介绍。此前，Grok 1.5已于四月发布。

大模型产品

Blobfish AI：投资人联络助手

摘要: Blobfish AI助力创始人快速联系投资人，通过AI分析和定制邮件，提高投资匹配度和投资组合价值。

Gainsty: 轻松获取真实Instagram粉丝

摘要: 通过AI和专家助力，Gainsty帮你在Instagram上实现病毒式增长，获取真实粉丝。7天免费试用，无风险。

Brev.ai：文字秒变高品质音乐

摘要: Brev.ai是一款AI音乐生成器，只需输入文字，即可轻松生成高质量歌曲和器乐，适用于视频、社交媒体等，免费在线使用。

Kotae智能聊天机器人

摘要: Kotae：无需编程，5分钟内部署，自动处理80%客户咨询，支持80+语言，享30天免费试用和个性化指导。

XspaceGPT：Twitter语音空间转文字

摘要: XspaceGPT将Twitter语音空间转化为文字，提供摘要、提纲、亮点及多语言支持。发现热门空间和影响力主持人，免费下载并探索知识库。

10xBeast：定制B2B销售邮件

摘要: 10xBeast帮助销售团队创建高度定制的邮件，节省时间，专注于建立关系，由AI驱动更多潜在客户。

Mistral Large 2：高级推理与多语言支持

摘要: Mistral Large 2在代码生成、数学和推理方面表现出色，提供强大的多语言支持和高级函数调用能力。

Last24.ai：24小时新闻一览

摘要: Last24是一款AI搜索引擎，自动搜集并总结过去24小时的重要新闻，以美观的思维导图呈现，让了解新闻变得简单有趣。

PixVerse V2：AI视频制作神器

摘要: 🚀 PixVerse V2重磅升级！🔥 8秒视频生成，细节与动作增强，1-5个片段风格一致，轻松讲述动人故事。

大模型论文

自训练与直接偏好优化提升推理能力

摘要: 本文提出通过自训练和直接偏好优化(DPO)提升小型语言模型在数学推理任务中的表现，提供更高效且可扩展的解决方案。

递归内省：提升语言模型自我改进能力

摘要: 本文提出RISE方法，通过迭代微调语言模型，使其在多轮交互中检测并纠正错误，提升数学推理任务表现。

大规模语言模型的鲁棒性研究

摘要: 研究发现，虽然大规模语言模型在对抗训练下表现更好，但在缺乏明确防御措施时，模型规模对鲁棒性提升有限。

大语言模型的非空泛泛化界限

摘要: 本文利用鞅性质和更宽松的压缩方法，为如LLaMA2-70B等大语言模型推导出非空泛的泛化界限。

Dallah: 先进的阿拉伯语多模态助手

摘要: Dallah是一个基于LLaMA-2的阿拉伯语多模态助手，支持六种阿拉伯方言，展示了在现代标准阿拉伯语和方言响应测试中的卓越表现。

弹性缓存：提升视觉指令模型推理效率

摘要: 提出弹性缓存方法，通过重要性驱动的缓存合并策略，优化视觉指令模型的缓存管理，提升推理效率与生成性能。

使用大型语言模型优化股票收益预测

摘要: 本文探讨了通过微调大型语言模型，利用金融新闻流进行股票收益预测，并比较了不同模型的表现和集成方法。

PEFT-U：用户个性化参数高效微调

摘要: 本文介绍了PEFT-U基准数据集，用于构建和评估NLP模型的用户个性化。PEFT-U包含多样化的用户任务，旨在高效地个性化大型语言模型，以满足用户特定偏好。

C2P：提升大语言模型因果推理能力

摘要: C2P是一种因果链提示框架，提升大语言模型因果推理能力，显著提高医疗、经济等领域的推理准确性。

ComPeer: 主动生成型同伴支持会话代理

摘要: ComPeer是一种生成型会话代理，利用大语言模型主动提供同伴支持，提升用户参与度和长期关系建立。

大模型开源项目

快速使用大型语言模型

摘要: 使用Go语言编写的Ollama项目，支持Llama 3.1、Mistral、Gemma 2等大型语言模型的快速部署与运行。

用街头霸王3评估LLM质量

摘要: OpenGenerativeAI通过让大型语言模型在街头霸王3中对战，提供了一种全新的评估LLM质量的方法。

本文由 mdnice 多平台发布

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
大模型日报 2024-07-29

斯坦福研究人员提出了一种名为对比偏好学习(CPL)的新机器学习框架，使用遗憾偏好模型来解决AI研究中对齐模型与人类偏好的挑战，特别是在高维和序列任务中。: 随着AI技术的发展，越来越多的AI模型训练数据来自其他AI模型生成的合成数据。: IBM研究人员提出了一种无需训练的新型AI方法，以减少大型语言模型（LLMs）在机器翻译、摘要和内容创作等应用中的幻觉现象。: Brev.ai是一款AI音乐生成器，只需输入文字，即可轻松生成高质量歌曲和器乐，适用于视频、社交媒体等，免费在线使用。7天免费试用，无风险。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。