自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(187)
  • 资源 (2)
  • 收藏
  • 关注

原创 大模型日报 2024-08-27

大语言模型(如OpenAI的ChatGPT、微软的Bing Chat和谷歌的Gemini)在与人类互动方式上带来了革命性变化,但也面临幻觉现象的挑战。Grok-2是否能代表AI的重大突破,还是只是又一次炒作,成为了业内热议的话题。: Nvidia通过在Verilog上训练的大语言模型(LLM)和自主AI代理,显著加快了其GPU、CPU和网络芯片的设计周期。: MBZUAI在一场顶级AI会议上发布了新的EXAMS-V数据集,旨在通过对视觉语言模型提出新的挑战,推动其边界的发展。

2024-08-27 20:58:28 749 1

原创 大模型日报 2024-08-26

LinkedIn推出了Liger(Linkedin GPU Efficient Runtime)内核,这是一款革命性工具,可将大语言模型(LLM)训练效率提高20%以上,同时减少60%的内存使用。本文综述了基于大语言模型的信息提取方法在放射学报告中的应用,探讨了其潜力和挑战。是一个免费开源的CLI工具,适用于Linux、Mac和Windows用户,集成强大的大语言模型,解决开发问题。: MuMA-ToM是首个评估多模态多智能体交互中心智推理的基准,验证了其在人类实验中的有效性,并提出了新模型LIMP。

2024-08-27 20:56:45 940

原创 大模型日报 2024-08-24

本文提出MedS-Bench基准,评估6种大模型在11项临床任务中的表现,并开发了MedS-Ins数据集提升模型性能。: Phi-3是微软开发的开源AI模型家族,具备高性价比,超越同类和更大模型,适用于语言、推理、编码和数学等领域。: MEDCO通过模拟真实医疗环境,结合多代理系统,提升医学教育中的互动性和多学科协作,显著改善学生学习表现。: GenderCARE框架通过创新标准和技术,评估与减少大型语言模型中的性别偏见,涵盖多样性和包容性。以上就是20240824的大模型日报,很高兴为你服务!

2024-08-27 20:52:46 426 1

原创 大模型日报 2024-08-23

VILA是一个多图像视觉语言模型,提供训练、推理和评估方案,可在云端和边缘设备(如Jetson Orin和笔记本)上部署,使用Python编写。: Helicone AI是一款开源的LLM可观测性平台,提供一行代码集成,支持成本跟踪、代理追踪和提示管理等功能,免费开始使用。: Kraftful 3.0利用AI从用户反馈中学习需求,收集新反馈,规划产品项目,并根据反馈撰写PRD,助力产品开发。: Phi-3是微软开发的开源AI模型家族,性能卓越且成本效益高,适用于语言、推理、编码和数学等任务。

2024-08-27 20:52:09 663

原创 大模型日报 2024-08-22

本文研究了LCCTs的安全风险,揭示了GitHub Copilot和Amazon Q在越狱和数据提取攻击中的脆弱性,并提出了改进建议。: EmailFlow.AI是一款AI平台,提供B2B潜在客户生成,整合冷邮件解决方案,智能平台涵盖邮件数据、SMTP服务和自动外展。: AgentQL利用AI技术,无需XPath或DOM选择器,通过自然语言查询实现可靠的数据抓取和网页自动化,即使网站更改也能应对。: CTP-LLM利用GPT-3.5模型,通过分析试验设计文档,自动预测临床试验阶段转换,准确率达67%。

2024-08-22 22:22:11 1128

原创 大模型日报 2024-08-21

本文研究了分布式训练中Transformer模型的通信行为,使用GPT模型作为案例,分析了序列长度、每GPU吞吐量、模型大小等因素,并提出优化建议。: Myko助理可帮助你从互联网研究任何信息,找到LinkedIn个人资料和邮件,准备会议账户,采集公共网页内容,每周节省数小时研究时间。: 本文提出SANER方法,通过消除CLIP文本特征中的属性信息,在无需属性标注的情况下有效减少社会偏见,且保留属性特定描述的原始信息。句子控制,AI语音转文字,实现影子练习。支持自托管、离线使用,且易于设置。

2024-08-22 22:21:36 580

原创 大模型日报 2024-08-20

本文介绍了PsychoLex资源套件,提升大语言模型在心理学任务中的表现,包含QA数据集和评估数据集,并优化了PsychoLexLLaMA模型,展示了其在心理应用中的优越性能。: 本文提出了FaST,通过动态选择快思和慢想模式,提升视觉代理在复杂任务中的表现,显著提高VQA和ReasonSeg的准确率。一键修复发现的错误,免费试用。: 本文提出了一种新的数据管道,针对LLM评估框架,创建多样化的领域特定评估集,显著提高了评估的有效性和透明度。通过新的提示框架,提升了机器翻译和逻辑推理等任务的性能。

2024-08-21 16:10:48 502

原创 大模型日报 2024-08-19

SWE-agent使用GPT-4或其他语言模型,自动修复GitHub问题。: 本文提出一种新颖的解耦对齐框架,通过投影层和表示正则化将大语言模型和协同模型的表示解耦为特定和共享组件,提升推荐任务性能。: 研究隐性语言对大模型偏见放大的影响,发现大模型更偏向显性观点,需引入不确定性标记以提升可靠性。: 本文评估大语言模型对符号图形程序的理解能力,提出了基准测试,并通过符号指令微调提升模型表现。: 本文提出BAM方法,通过充分利用密集模型的FFN和注意力参数,提升专家混合模型的性能和效率。

2024-08-21 16:09:20 550

原创 大模型日报 2024-08-18

Boggl AI是一款语音驱动的产品管理助手,能将随意的语音记录自动转化为精美的需求、发布说明和客户文档,并集成Jira、Google Docs、Notion。: MindGuide是一款iOS上的AI心理健康教练,提供治疗、生活指导和专家建议,帮助你应对挑战,实现目标,提升心理健康。: drippi是一款社交媒体应用,拍摄好友照片,输入关键词,即可将好友的服装变成你想要的样子,体验变身乐趣。: BAM方法通过全面利用稠密模型的FFN和注意力参数,提升专家混合模型的性能和效率,适用于大规模语言模型。

2024-08-21 16:08:24 867

原创 大模型日报 2024-08-17

NIH研究发现,大型语言模型在评估医疗问题时依赖于简洁、类似教科书的语言,而难以从患者书写的描述中准确识别遗传病。: 位于班加罗尔的人工智能初创公司Sarvam AI推出了Sarvam 2B,这是一款拥有20亿参数的开源大型语言模型,支持10种印度语言。: 本研究提出了一种系统设计方法,利用大语言模型(LLM)进行数据标注,提升下游监督学习任务的分类性能,适用于多种行业应用。: 本文评估大语言模型对符号图形程序的理解能力,通过创建基准测试,发现其在推理视觉场景方面的表现,并提出符号指令调优方法。

2024-08-21 16:06:30 922

原创 大模型日报 2024-08-16

研究表明,随着语言能力的提升,大型语言模型(如GPT-4)会发展出自己的现实理解。: 美国国立卫生研究院(NIH)的研究人员发现,虽然人工智能(AI)工具可以做出准确的诊断,但当医疗问题以普通话表达时,ChatGPT的表现存在困难。: 研究表明,通过自我优化和演绎闭包训练,可以在不增加负担的情况下,提高AI语言模型的准确性。这一方法为大型语言模型的发展提供了新的思路和方向。: 本文提出一种统一框架,使大语言模型能自选示例优化上下文,通过强化学习提升示例选择和排序,实验验证了该方法的有效性。

2024-08-17 21:46:12 945

原创 大模型日报 2024-08-15

新方法提出在无需大量数据的情况下合并专用大语言模型(LLM),为模型优化和应用提供了新的思路。然而,研究人员也提出了可能的解决方法。: 本论文探讨了大语言模型在解决作业车间调度问题中的潜力,并引入了首个专用的12万条数据集,结果显示其性能可与其他神经网络方法媲美。: 本文提出Re-TASK框架,从能力、技能和知识角度系统分析和提升大语言模型在领域任务中的表现,实验结果验证了其有效性。: Meta的Llama 3 70B开源大语言模型在回答选择题时,表现与专有模型相当,展示了其在放射学领域的潜力。

2024-08-17 21:45:41 738

原创 大模型日报 2024-08-14

虽然大型语言模型在各类应用中取得了显著进展,但它们仍面临诸多挑战。: 牛津互联网研究所的领先监管和伦理专家指出,大型语言模型(LLMs)带来了新的危害类型,呼吁对其进行更严格的监管,以防范其对社会可能造成的风险。: 一种类似于ChatGPT的大型语言模型被用于开发一种改良版的杀菌药物,将原本有毒的抗生素转变为救命药物,展现了人工智能在医疗领域的巨大潜力。: 伦敦消息,2024年8月13日,一项新的研究表明,ChatGPT等大型语言模型(LLMs)没有独立学习或自我发展的能力,因此不构成生存风险。

2024-08-14 17:44:09 1030

原创 大模型日报 2024-08-13

这些模型的开发目标是创建通用的AI助手,推动多模态技术的发展。: 技术创新研究院(TII)推出了新的大型语言模型Falcon Mamba 7B,该模型采用状态空间语言模型技术,旨在提升自然语言处理的性能和效率。: Recap是一款AI生成的邮件简报工具,定期将你最近的笔记和书签发送到你的邮箱,并附上每个文件、笔记或链接的便捷AI摘要,帮助你反思和回顾。: Qwen2-Audio发布,这是一款革命性的音频语言模型,以无与伦比的精准度和多样的交互能力,克服了复杂的音频挑战。

2024-08-14 17:42:08 539

原创 大模型日报 2024-08-12

该模型通过结构化的高维人体表征、结构化的自动解码器和结构化的隐空间扩散模型,能够生成高质量、多样化且视角一致的三维数字人,并支持不同层级的可控生成与编辑功能。这篇文章介绍了腾讯「元宝」推出的「深度阅读模式」,该模式支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。通过提供结构化信息、图表和对论文优缺点的分析,该模式帮助研究者节省阅读和理解论文的时间,使他们能够更快地聚焦于与自己研究直接相关的论文。豆包团队通过图文匹配、文本理解和模型架构的优化,实现了更强的图像生成能力和更快的出图速度。

2024-08-12 21:26:07 435

原创 大模型日报 2024-08-11

Meta FAIR的Chameleon团队提出了一种新的单一Transformer架构,可以根据下一个token的预测目标,对由离散图像和文本token组成的混合模态序列进行建模,从而在不同模态之间进行无缝推理和生成。该文章介绍了苹果研究人员提出的一种新的视频大语言模型(LLM)架构,名为SlowFast-LLaVA(SF-LLaVA)。该模型通过两种不同的观察速度(Slow和Fast)来理解视频中的细节和运动,解决了现有视频LLM的痛点。文章还介绍了数据构建过程和主流多模态大语言模型的评测结果。

2024-08-11 22:42:17 421

原创 大模型日报 2024-08-10

该团队提出了一种模态感知型混合专家(MoMa)架构,通过将模态感知模块集成到前向模块中,优化了标准混合专家(MoE)架构。通过升级改造方法,团队改善了模型训练效率,并在不同模态的专家分组中取得了显著的性能提升。此次展示是在其从液压驱动转向全电驱动后的首次亮相,尽管缺少手指,但其表现引发了网友的热议和对比,尤其是与其他人形机器人如特斯拉的擎天柱2代和Figure 02的比较。一款新发布的AI换脸软件可以实时将单张照片换脸,安装简单且不挑硬件,吸引了大量用户关注。大模型日报 2024-08-10。

2024-08-11 22:40:51 429

原创 大模型日报 2024-08-09

文章讨论了OpenAI的匿名聊天机器人模型及其在逻辑推理方面的表现,并提到了正在开发的“草莓”项目,同时关注了OpenAI内部的人员流动及其对公司未来的影响。吴恩达教授推出了名为AI Python for Beginners的新课程,适合编程初学者,涵盖Python基础知识和AI应用,提供免费的实践方法和即时反馈。介绍了字节跳动豆包大模型团队与香港大学联合提出的ByteCheckpoint系统,显著提升了大模型训练过程中的Checkpoint保存和加载性能。大模型日报 2024-08-09。

2024-08-09 23:40:22 197

原创 大模型日报 2024-08-09

腾讯编码器在MSU世界视频编码器大赛中获得全部指标第一名,Tencent TVC和Tencent266编码器表现出色。阿里通义开源Qwen2-Math数学模型,成为处理多种数学问题的先进模型,支持英文,中英双语版本即将推出。OpenAI发布基于GPT-4o的全面安全评估,GPT-5未发布,GPT-4o在安全性方面受到质疑。DeepMind开发的乒乓球机器人在与人类对战中达到业余选手水平,特别在初学者中全胜。大模型日报 2024-08-09。

2024-08-09 23:38:32 242

原创 大模型日报 2024-08-07

简介:介绍空间大模型 SpatialBot,能理解 RGB-Depth 获深度值理解空间概念,提出 SpatialQA 数据集,有示例对话和深度图理解说明,具参考价值。简介:Figure 发布新一代人形机器人 Figure 02,具多种功能,能实时对话、自主执行任务,导航用 VLM,电池续航提升,机械手先进,随运行收集数据提升性能。简介:MIT 科学家创建深度学习系统「Mirai」,根据乳房 X 光预测乳腺癌风险,准确评估,适应不同临床环境,优于以往方法,正合作进一步验证和研究临床实施。

2024-08-07 20:40:07 239

原创 大模型日报 2024-08-06

简介:智谱 AI 发布的国产视频生成模型 Sora「清影」6 天内生成视频超百万,开源同源模型 CogVideoX,支持单张 4090 显卡推理,生成 6 秒 720p 视频。简介:AI 芯片独角兽 Groq 完成 6.4 亿美元融资,估值暴涨,聘请 Yann LeCun 任技术顾问,其芯片在推理 Llama-3 8b 模型中有出色表现。简介:MiniCPM-V 2.6 是新端侧多模态 AI 模型,具多图联合理解和复杂推理能力,支持多图 ICL,性能提升,低幻觉率高效能。面壁小钢炮开源史上最强端侧多模态]

2024-08-07 20:37:55 444

原创 大模型日报 2024-08-05

tinyBenchmarks通过使用100例精选集,大幅降低了大型语言模型(LLM)评估的成本,减少超过98%,同时保持了高准确性。: DynamoLLM通过动态重配置推理集群,实现LLM推理的节能与成本优化,在满足性能SLO的同时,节省53%能源和61%成本。: AgentGen框架通过自动生成多样化环境和任务,提升LLM的规划能力,显著优于GPT-3.5,部分任务超越GPT-4。: 研究了大语言模型推理的计算优化,通过不同模型尺寸和计算预算的树搜索算法,找到小模型和复杂解码算法的最佳平衡。

2024-08-05 20:37:58 881

原创 大模型日报 2024-08-04

作为Facebook的母公司,Meta通过此举展示了其对开源AI的支持和推动,可能对未来AI技术的发展产生深远影响。作为Facebook的母公司,Meta希望通过这次发布推动AI技术的开放和共享,促进整个行业的发展。它提供了强大的工具和库,用于构建和训练机器学习模型。: DynamoLLM通过动态重配置推理集群,在满足性能SLO的同时,节省53%能量,减少38%碳排放和61%的客户成本。: 本文提出了一种名为TAR的方法,用于在开放权重的LLM中构建防篡改保障,经过大量评估和红队分析,验证了其有效性。

2024-08-04 23:52:28 992

原创 大模型日报 2024-08-03

GitHub Models是一项新功能,允许用户测试来自Meta、OpenAI、Mistral等公司的流行大型语言模型,包括GPT-4o和Llama 3.1等。: 本文提出AgentGen框架,通过自动生成多样环境和任务,提升大语言模型(LLM)的规划能力。: DynamoLLM是一种能效管理框架,通过动态重构推理集群,在满足性能SLO的前提下,节省53%能量和38%碳排放,降低61%成本。: iVu.Ai是一款AI对话搜索引擎,利用NLP和机器学习算法,深度搜索互联网,提供准确、详细且有来源的答案。

2024-08-04 23:51:33 863

原创 大模型日报 2024-08-01

百度推出了一种新型自我推理AI框架,旨在提升语言模型的可靠性,有望消除语言模型中的“幻觉”现象。为了有效测试脑行为机器学习模型,需要使用大规模的数据集。: 科技巨头Meta宣布其最新的开源AI模型Llama 3.1具备'最先进的能力',被称为全球最大和最强的AI模型。: ThinK通过剪枝KV缓存中的冗余通道,在不损失精度的情况下减少超过20%的内存消耗,有效提升LLM推理效率。: 提出一种基于大语言模型的自动化文献综述生成方法,显著减少认知负荷,验证在丙烷脱氢催化剂上的应用效果。

2024-08-02 22:48:07 946

原创 大模型日报 2024-08-02

初创公司Lelapa AI推出InkubaLM,这是一款从零开始训练的大型语言模型,使用了19亿个数据标记,覆盖了五种广泛使用的非洲语言,旨在促进非洲语言的技术发展。: 德克萨斯大学奥斯汀分校的研究人员利用人工智能,开发出安全且有效的新型抗生素,旨在应对耐药细菌的威胁。: 本文综述了视觉语言模型时代的广义OOD检测,探讨了AD、ND、OSR、OD等问题的演变和挑战,并展望了未来方向。: Not Diamond自动调用最佳模型,并根据您的反馈实时改进,持续学习您的偏好,是您唯一需要的聊天助手。

2024-08-02 22:41:46 1055

原创 大模型日报 2024-07-31

2024年7月24日,Mistral AI宣布推出其下一代旗舰大语言模型Mistral Large 2,这是一款先进的多语言大模型,现已在IBM watsonx平台上可用。测试结果显示,中端和开源的大型语言模型表现优异,获得了高分评价。: ODYSSEY是一个新的开源AI框架,旨在赋能基于大型语言模型(LLM)的代理,具备开放世界技能,从而能够探索广阔的Minecraft世界。: 科技巨头Meta宣布其最新的开源AI模型Llama 3.1具备“最先进的能力”,被誉为全球最大和最强的AI模型。

2024-07-31 19:26:16 340

原创 大模型日报 2024-07-30

Yandex研究团队与IST奥地利和NeuralMagic的研究人员合作,开发出新的方法压缩大型语言模型,显著降低AI部署成本,最多可减少8倍。: Meta表示,由于欧盟法规的限制,无法使用Facebook和Instagram数据来训练AI产品,这将导致其AI助手在欧洲成为“二流产品”,因此决定不在欧洲发布其AI助手。: TD银行正在测试来自多伦多初创公司Cohere的AI语言模型,旨在评估其性能,并与大型科技公司的模型进行对比,以便未来可能应用于银行业务中。

2024-07-30 23:34:01 350

原创 大模型日报 2024-07-29

斯坦福研究人员提出了一种名为对比偏好学习(CPL)的新机器学习框架,使用遗憾偏好模型来解决AI研究中对齐模型与人类偏好的挑战,特别是在高维和序列任务中。: 随着AI技术的发展,越来越多的AI模型训练数据来自其他AI模型生成的合成数据。: IBM研究人员提出了一种无需训练的新型AI方法,以减少大型语言模型(LLMs)在机器翻译、摘要和内容创作等应用中的幻觉现象。: Brev.ai是一款AI音乐生成器,只需输入文字,即可轻松生成高质量歌曲和器乐,适用于视频、社交媒体等,免费在线使用。7天免费试用,无风险。

2024-07-29 17:53:21 457

原创 大模型日报 2024-07-28

研究人员警告,模型从其他模型生成的数据中不加区分地学习,会引发退化过程,导致模型逐渐遗忘真实信息。: Dallah 是一种高效的阿拉伯语多模态助手,基于LLaMA-2模型,支持六种阿拉伯方言,展示了在多模态交互任务中的卓越性能。: Friend AI项链,开源智能助手,倾听、记录对话、记笔记、准备任务,实时通知,全面记忆辅助,探索AI可穿戴设备未来!: Meta公司宣布其最新的开源AI模型Llama 3.1具备'最先进的能力',被称为全球最大和最强的AI模型。

2024-07-28 20:42:56 386

原创 大模型日报 2024-07-27

研究人员警告,盲目学习其他模型生成的数据会导致大语言模型(LLM)出现退化现象,随着时间的推移,模型会逐渐忘记真实信息。这一进展或将提升聊天机器人的性能和用户体验。: Dallah利用LLaMA-2模型,支持阿拉伯语多模态交互,精通六种方言,表现优异,推动多模态阿拉伯语模型发展。: Meta Llama 3是Meta官方发布的AI项目,使用Python语言编写,提供最新的AI技术和工具。: Meta宣布其最新的开源AI模型Llama 3.1具有‘最先进的能力’,被称为全球最大和最强的AI模型。

2024-07-27 21:10:13 388

原创 大模型日报 2024-07-26

Mistral AI推出新语言模型Mistral Large 2,在HumanEval和MultiPL-E等基准测试中表现优异,超越了包括Llama 3.1 405B instruct在内的同类模型。: 本文提出了一种新方法,通过自我增强和专家增强步骤改进数据质量和模型性能,形成VILA^2模型家族,并在多项任务中取得了最新的开源模型最佳结果。: 法国AI公司Mistral发布了其新AI模型Large 2,据称性能超越了Meta的Llama 3.1和OpenAI的GPT-4o。

2024-07-26 17:20:04 322 1

原创 大模型日报 2024-07-25

本文介绍了Meta最新发布的Llama 3.1大型语言模型的亮点和特性。: Meta公司于周二发布了新的AI语言模型Llama 3.1 405B,这是首个任何人都可以下载的GPT-4级AI模型,在AI界引起了广泛关注。: Meta于周二宣布推出Llama 3.1 405B,这是一款大型语言模型,旨在与Anthropic、谷歌和OpenAI的顶级模型竞争。: Meta公司周二发布了其Llama 3人工智能模型的最大版本,主要特点是免费并具备多语言能力,显著提升了语言和数学方面的表现。

2024-07-25 17:17:17 718

原创 <section id=“nice“ data-tool=“mdnice编辑器“ data-webs

本文介绍了Chain-of-Sight视觉语言桥模块,通过减少预训练阶段的视觉标记数量,加速多模态大语言模型预训练,节省约73%的训练时间,同时保持或提升性能。: Meta发布了最新版本的Llama 3.1 AI模型,这一模型不仅更加强大且免费,还提升了人工智能的可访问性和定制化能力。该模型主要免费提供,并在多语言处理和数学能力方面表现出色。: AutoAD-Zero利用视觉语言模型和大语言模型,通过视觉和文本提示策略,无需训练生成电影和电视剧的音频描述,并提出了一个新的音频描述数据集。

2024-07-24 13:52:54 936 1

原创 大模型日报 2024-07-23

本文提出CHOPINLLM,通过结合原始数据值和文本表示进行预训练和微调,提高多模态语言模型对图表的理解能力,并建立新的评估基准。: 斯坦福大学的研究致力于通过心智理论和大型语言模型,开发能够在复杂社会环境中自适应运行的自主智能体,推动多智能体强化学习的发展。: 本文研究大语言模型自解释的可靠性,发现反事实解释能生成真实、信息丰富且易验证的结果,提供传统解释方法的替代方案。: 提出了一种基于反事实解释的放射报告生成框架CoFE,通过对比事实和反事实图像表示,生成语义连贯且事实完整的报告。

2024-07-23 11:09:38 947

原创 大模型日报 2024-07-22

大模型日报2024-07-22大模型资讯谷歌将在ICML 2024展示机器学习研究成果摘要: 谷歌研究人员将在ICML 2024会议上展示他们在机器学习领域的探索,从理论到应用,构建解决深层问题的ML系统。代理符号学习:优化AI系统符号组件的框架摘要: 大型语言模型(LLMs)革新了人工智能领域,使得创建语言代理成为可能。代理符号学习是一种AI框架,能够在代理系统内联合优化所有符号组件。腾讯提升10万GPU AI集群网络效率,通信效率提高60%,LLM训练效率提升20%摘要: 腾

2024-07-22 20:03:35 1047 1

原创 大模型日报 2024-07-21

OpenAI发布了针对应用开发者的GPT-4o mini模型,取代了旧版的GPT-3.5模型。: 研究开发了一个基于游戏Baba Is You的新基准,测试了三种多模态大型语言模型,发现它们在需要操控和组合游戏规则时表现不佳。: 谷歌AI发布了一篇关于FLAMe的论文,这是一种基础大型自动评估模型,旨在为复杂多样的大型语言模型提供可靠且高效的评估方法。: 研究表明,通过Prover-Verifier游戏训练算法,提升了大语言模型在解决数学问题时的输出可读性和人类验证准确率。

2024-07-21 12:44:24 928

原创 大模型日报 2024-07-20

OpenAI发布了针对应用开发者的GPT-4o mini模型,取代了旧版的GPT-3.5模型。: 研究开发了一个基于游戏Baba Is You的新基准,测试了三种多模态大型语言模型,发现它们在需要操控和组合游戏规则时表现不佳。: 谷歌AI发布了一篇关于FLAMe的论文,这是一种基础大型自动评估模型,旨在为复杂多样的大型语言模型提供可靠且高效的评估方法。: 研究表明,通过Prover-Verifier游戏训练算法,提升了大语言模型在解决数学问题时的输出可读性和人类验证准确率。

2024-07-21 12:40:56 740

原创 大模型日报 2024-07-19

简介:介绍华为 GTS LocMoE+的研究成果,提出高可扩展性亲和度路由策略,结合传统与主动路由,提升处理判别性 token 概率,降低样本噪声和提升训练效率。简介:OpenAI 推出 GPT-4o Mini 模型,性能优于 GPT-4,价格便宜,支持多种输入输出和大上下文窗口,旨在普及 AI 技术。简介:小冰公司上线“零样本”数字人技术,依托超千亿大模型基座,压缩训练数据和定制时间,数字员工产品线进行三大升级,适配不同业务场景。[世界首部生成电影,每次播放都不一样,AI:我剪了 52 万亿亿个版本]

2024-07-19 22:37:26 576

原创 大模型日报 2024-07-18

简介:AutoGPT 的下一代版本发布,具有定制节点和多智能体协同功能,在 GitHub 上获超 16 万星标,新版本使构建、运行和共享 AI 智能体更易更可靠,支持自定义添加节点等。简介:英伟达宣布全面开源 GPU 内核驱动,发布最新 555 Linux 驱动程序系列,开源驱动支持新功能但部分 GPU 不兼容,其开源举措有进展也有限制。简介:文章介绍对抗性小学数学应用题评测集 GSM-Plus,分析语言模型解决数学应用题的鲁棒性,多数模型面临扰动性能下降。大模型日报 2024-07-18。

2024-07-19 22:22:40 249

The Global Generative AI Landscape 2024

Generative AI (GenAI)The Global GenerativeAILandscape2024AIport 2024最新 2024年全球生成人工智能全景图

2024-03-22

java对打游戏

java课程的大作业,还在进一步完善中。能控制玩家跑动

2018-10-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除