大模型日报
2024-07-26
大模型资讯
-
摘要: 研究人员指出,使用AI生成的数据集来训练未来的机器学习模型可能会污染其输出,这一现象被称为模型崩溃。
-
摘要: 研究人员让大型语言模型的连续版本使用前几代AI生成的信息,结果观察到这些模型迅速产生无意义内容。这表明,AI模型在使用自身生成的数据时,可能会导致性能下降和内容质量问题。
-
摘要: 谷歌的新进展结合了大型语言模型和自我学习AI技术。这一技术有望解决AI的一些不足之处,尽管仍有待进一步验证。
-
摘要: Mistral AI于周三发布了一款拥有1230亿参数的大型语言模型Mistral Large 2 (ML2)。该模型被称为GPT-4级AI模型的精简且更强大的竞争对手。
-
摘要: Mistral AI推出新语言模型Mistral Large 2,在HumanEval和MultiPL-E等基准测试中表现优异,超越了包括Llama 3.1 405B instruct在内的同类模型。
-
摘要: 文章介绍了Meta最新发布的大语言模型Llama 3.1的亮点和特色。Llama 3.1是Meta推出的新版本,具备多项改进和新功能。
-
摘要: 法国AI公司Mistral发布了其新AI模型Large 2,据称性能超越了Meta的Llama 3.1和OpenAI的GPT-4o。
-
摘要: Meta推出了最新的大语言模型Llama 3.1 405B。根据Facebook母公司Meta的说法,这款新模型是其最新的开源AI大语言模型。
-
摘要: Llama 3.1系列模型的开放性和准确性对企业是一个福音,但对封闭系统的LLM供应商构成了生存威胁。分析师和专家指出,这可能会对现有市场格局产生重大影响。
-
摘要: 一项新发表的研究论文表明,算法生成的网络内容的激增可能会降低大语言模型的准确性。这一发现引发了对AI生成内容对语言模型训练数据质量影响的担忧。
大模型产品
-
摘要: Hey AI利用AI互动颠覆传统约会应用,无需滑动、重复对话和找话题,打造人人专属的AI丘比特。
-
摘要: Speech to Note是一款AI工具,可将语音转换为文字笔记,并提供37种以上的摘要格式选择。
-
摘要: Tern是一款个性化AI旅行规划工具,快速生成行程(<1分钟),可编辑,与好友协作,并在地图上可视化。
-
摘要: Mermaid AI通过快速生成图表革命性地简化了图表创建过程,告别复杂耗时的工具,实现快速清晰的可视化表达。
-
摘要: Tidyread使用AI自动整理和总结你的订阅内容,在你选择的时间提供简洁的摘要,让你更高效地阅读。
-
摘要: 上传简历,AI帮你自动申请工作,生成个性化简历和求职信。你可以自己申请,也可以让AI代劳。
-
摘要: Apex助力Webflow网站实现邮件营销自动化。使用可视化旅程构建器,创建个性化用户旅程,基于实时事件触发邮件。
-
摘要: Qovai是No.1 AI平台,帮助生成社交媒体轮播帖子和广告,并实现自动发布。
-
摘要: Hemingway Editor Plus利用AI工具优化你的写作,提高可读性并修正语法问题,同时保留你的语气和风格。
-
摘要: 无需编写代码,使用Tempest AI轻松创建、玩耍和分享无限RPG游戏,只需2分钟即可完成。
大模型论文
-
摘要: 研究表明,现有大模型在改写无答案问题方面能力有限。GPT-4和Llama2-7B成功率分别为26%和12%。
-
摘要: 本文介绍了WildHallucinations基准,通过真实用户聊天实体评估LLM的事实性。研究发现LLM在无维基百科页面实体上虚假信息更多,检索组件仅稍微减少虚假信息。
-
摘要: 研究发现了损失、混合比例和训练数据规模之间的幂律关系,提出了优化LLM持续预训练的关键混合比例(CMR)及其扩展法则。
-
摘要: 本文提出了一种新方法,通过自我增强和专家增强步骤改进数据质量和模型性能,形成VILA^2模型家族,并在多项任务中取得了最新的开源模型最佳结果。
-
摘要: 研究水印技术对大语言模型生成版权内容的抑制效果,并探讨其对成员推断攻击的影响及改进方法。
-
摘要: PASS是一种利用视觉提示和网络权重统计的超网络框架,可递归输出层级通道稀疏性,提高模型效率和准确性。
-
摘要: 本文提出利用大语言模型和语法结构生成游戏描述的方法,通过迭代解码提升生成效果,实验结果显示该方法表现良好。
-
摘要: 本文提出City-3DQA数据集和Sg-CityU方法,提升城市级场景理解的3D多模态问答性能,达到SOTA水平。
-
摘要: PERSONA通过生成1586个多样用户角色,创建大规模评估数据集,评估和改进语言模型的多元对齐能力。
-
摘要: 本文提出MMRA基准,包含1026个样本,用于评估LVLMs在多图像关系关联任务中的表现,发现细粒度任务仍具挑战性。
大模型开源项目
-
摘要: Meta Llama 3 是Meta官方发布的AI项目,使用Python语言编写,提供最新的人工智能解决方案。
-
摘要: ggerganov项目使用C/C++语言实现了大语言模型(LLM)的推理功能,提升了性能和效率。
-
摘要: Meta-Llama项目提供了CodeLlama模型的推理代码,使用Python语言编写,适用于AI开发者和研究人员。
本文由 mdnice 多平台发布