自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(159)
  • 资源 (2)
  • 收藏
  • 关注

原创 大模型日报 2024-07-25

本文介绍了Meta最新发布的Llama 3.1大型语言模型的亮点和特性。: Meta公司于周二发布了新的AI语言模型Llama 3.1 405B,这是首个任何人都可以下载的GPT-4级AI模型,在AI界引起了广泛关注。: Meta于周二宣布推出Llama 3.1 405B,这是一款大型语言模型,旨在与Anthropic、谷歌和OpenAI的顶级模型竞争。: Meta公司周二发布了其Llama 3人工智能模型的最大版本,主要特点是免费并具备多语言能力,显著提升了语言和数学方面的表现。

2024-07-25 17:17:17 427

原创 <section id=“nice“ data-tool=“mdnice编辑器“ data-webs

本文介绍了Chain-of-Sight视觉语言桥模块,通过减少预训练阶段的视觉标记数量,加速多模态大语言模型预训练,节省约73%的训练时间,同时保持或提升性能。: Meta发布了最新版本的Llama 3.1 AI模型,这一模型不仅更加强大且免费,还提升了人工智能的可访问性和定制化能力。该模型主要免费提供,并在多语言处理和数学能力方面表现出色。: AutoAD-Zero利用视觉语言模型和大语言模型,通过视觉和文本提示策略,无需训练生成电影和电视剧的音频描述,并提出了一个新的音频描述数据集。

2024-07-24 13:52:54 745

原创 大模型日报 2024-07-23

本文提出CHOPINLLM,通过结合原始数据值和文本表示进行预训练和微调,提高多模态语言模型对图表的理解能力,并建立新的评估基准。: 斯坦福大学的研究致力于通过心智理论和大型语言模型,开发能够在复杂社会环境中自适应运行的自主智能体,推动多智能体强化学习的发展。: 本文研究大语言模型自解释的可靠性,发现反事实解释能生成真实、信息丰富且易验证的结果,提供传统解释方法的替代方案。: 提出了一种基于反事实解释的放射报告生成框架CoFE,通过对比事实和反事实图像表示,生成语义连贯且事实完整的报告。

2024-07-23 11:09:38 856

原创 大模型日报 2024-07-22

大模型日报2024-07-22大模型资讯谷歌将在ICML 2024展示机器学习研究成果摘要: 谷歌研究人员将在ICML 2024会议上展示他们在机器学习领域的探索,从理论到应用,构建解决深层问题的ML系统。代理符号学习:优化AI系统符号组件的框架摘要: 大型语言模型(LLMs)革新了人工智能领域,使得创建语言代理成为可能。代理符号学习是一种AI框架,能够在代理系统内联合优化所有符号组件。腾讯提升10万GPU AI集群网络效率,通信效率提高60%,LLM训练效率提升20%摘要: 腾

2024-07-22 20:03:35 968 1

原创 大模型日报 2024-07-21

OpenAI发布了针对应用开发者的GPT-4o mini模型,取代了旧版的GPT-3.5模型。: 研究开发了一个基于游戏Baba Is You的新基准,测试了三种多模态大型语言模型,发现它们在需要操控和组合游戏规则时表现不佳。: 谷歌AI发布了一篇关于FLAMe的论文,这是一种基础大型自动评估模型,旨在为复杂多样的大型语言模型提供可靠且高效的评估方法。: 研究表明,通过Prover-Verifier游戏训练算法,提升了大语言模型在解决数学问题时的输出可读性和人类验证准确率。

2024-07-21 12:44:24 869

原创 大模型日报 2024-07-20

OpenAI发布了针对应用开发者的GPT-4o mini模型,取代了旧版的GPT-3.5模型。: 研究开发了一个基于游戏Baba Is You的新基准,测试了三种多模态大型语言模型,发现它们在需要操控和组合游戏规则时表现不佳。: 谷歌AI发布了一篇关于FLAMe的论文,这是一种基础大型自动评估模型,旨在为复杂多样的大型语言模型提供可靠且高效的评估方法。: 研究表明,通过Prover-Verifier游戏训练算法,提升了大语言模型在解决数学问题时的输出可读性和人类验证准确率。

2024-07-21 12:40:56 668

原创 大模型日报 2024-07-19

简介:介绍华为 GTS LocMoE+的研究成果,提出高可扩展性亲和度路由策略,结合传统与主动路由,提升处理判别性 token 概率,降低样本噪声和提升训练效率。简介:OpenAI 推出 GPT-4o Mini 模型,性能优于 GPT-4,价格便宜,支持多种输入输出和大上下文窗口,旨在普及 AI 技术。简介:小冰公司上线“零样本”数字人技术,依托超千亿大模型基座,压缩训练数据和定制时间,数字员工产品线进行三大升级,适配不同业务场景。[世界首部生成电影,每次播放都不一样,AI:我剪了 52 万亿亿个版本]

2024-07-19 22:37:26 531

原创 大模型日报 2024-07-18

简介:AutoGPT 的下一代版本发布,具有定制节点和多智能体协同功能,在 GitHub 上获超 16 万星标,新版本使构建、运行和共享 AI 智能体更易更可靠,支持自定义添加节点等。简介:英伟达宣布全面开源 GPU 内核驱动,发布最新 555 Linux 驱动程序系列,开源驱动支持新功能但部分 GPU 不兼容,其开源举措有进展也有限制。简介:文章介绍对抗性小学数学应用题评测集 GSM-Plus,分析语言模型解决数学应用题的鲁棒性,多数模型面临扰动性能下降。大模型日报 2024-07-18。

2024-07-19 22:22:40 230

原创 因果链,让大模型学会推理

为了评估其泛化性能,他们在简单的大小为 3-6 个节点的因果无关公理链上进行了训练,然后测试了泛化性能的多个不同方面,包括长度泛化性能(大小 7-15 的链)、名称泛化性能(更长的变量名)、顺序泛化性能(带有反向的边或混洗节点的链)、结构泛化性能(带有分支的图谱)。要创建训练数据集,该团队的做法是在特定的变量设置 X、Y、Z、A 下枚举所有可能的元组 {(P, H, L)}_N,其中 P 是前提,H 是假设,L 是标签(Yes 或 No)。AI 要在这些领域大战拳脚,强大可靠的因果推理能力是必不可少的。

2024-07-17 22:00:26 555

原创 大模型日报 2024-07-17

Nature 子刊,使用 3D transformer 和 HMM 对冷冻电镜密度图进行从头原子蛋白结构建模][快手开源 LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移][公理训练让 LLM 学会因果推理:6700 万参数模型比肩万亿参数级 GPT-4][Mistral AI 两连发:7B 数学推理专用、Mamba2 架构代码大模型][将慢思考蒸馏进快思考,Meta 把 Llama2 跃升至 GPT-4 水平]大模型日报 2024-07-17。

2024-07-17 21:48:37 482

原创 大模型日报 2024-07-16

北大 aiXcoder 团队基于大模型的 AI Agent 技术应用于软件开发。新视觉语言模型 EVE 去除视觉编码器且表现出色。将多种设备组合运行 Llama 3 模型的方法。厦门大学提出新的多模态特征提取框架及实验成果。探讨机器人学和机器学习的发展与挑战。大模型日报 2024-07-16。介绍基于公理训练的因果推理研究。

2024-07-16 22:24:11 178

原创 大模型日报 2024-07-15

GraphRAG 开源项目受关注,在知识图谱领域优势明显。美国在 AI 军事领域的投入和发展。Meta 新研究提高推理任务性能。大模型日报 2024-07-15。

2024-07-15 22:48:08 204

原创 OpenAI新模型「草莓」曝光

长任务规划,包括提前进行规划,自主可靠地在互联网上导航。:Organizations,AI可以像管理者完成工作。:对OpenAI在重大研究方向上的持续投入表示感慨。:Innovators,AI可以辅助发明创造。:超大规模数据集上完成预训练,采用特殊方法。:包括微调、人类反馈强化学习(RLHF)等。:Reasoners,人类级问题解决能力。:Agents,可以代表用户采取行动。:Chatbots,具备对话能力。:草莓(Strawberry):工作机制在内部被严格保密。:对AI潜在风险表示关注。

2024-07-14 18:33:47 740 1

原创 大模型日报 2024-07-14

通过因果模型构建数据集,教模型学习公理,67M 参数的微型 Transformer 能媲美 GPT-4 推理能力。报道美国老年人使用 AI 机器人伴侣情况,介绍 84 岁的 Dorothy Elicati 及 AI 机器人 ElliQ 对她的帮助,纽约州免费发放 ElliQ 计划,机器人功能和使用,以及一些人对机器人使用的担忧。介绍关于物理神经网络(PNN)的研究论文,被认为是改变 AI 系统的关键,可实现前所未有的模型规模,详细介绍 PNN 定义、分类和训练方法及应用,论文合著者来自顶尖机构。

2024-07-14 18:23:10 216 1

原创 大模型日报 2024-07-13

DeepMind 研究者提出分层视觉-语言-行动导航策略 Mobility VLA,用于多模态指示导航任务,结合长上下文多模态视觉语言模型和基于拓扑图的低级导航策略,在实验中表现出色。OpenAI 发布新模型「草莓」,具备强推理和长任务规划能力,进行超大规模训练,OpenAI 还给出 AGI 分级,马斯克表示关注。介绍 OpenAI Lilian Weng 关于《LLM 幻觉:从理解到克服》的文章,讨论减少幻觉的方法、评估基准和相关研究工作。

2024-07-13 20:57:24 195

原创 大模型日报 2024-07-12

路线图划分聊天机器人(L1)、推理者(L2)、智能体(L3)、创新者(L4)和组织者(L5)五个等级。AGI 是在最具经济价值任务中超越人类的高度自治系统,OpenAI 与洛斯阿拉莫斯国家实验室合作测试 GPT-4o 功能并建立安全规范,AGI 到来时间众说纷纭,Sam Altman 等人预计十年内实现。通过分解复杂视频推理问题为系列子问题,结合时空场景图(STSG)和视频多模态大模型,实现对视频的深入理解和推理,在各类视频 QA 上性能超越传统视频多模态大模型和 CoT 方法。

2024-07-13 20:29:08 358 1

原创 2024全网最全AI工具集合

描述:Inflection AI 推出的个人 AI 聊天助理。描述:OpenAI 推出的 AI 聊天机器人和智能对话工具。描述:MiniMax 推出的 AI 虚拟社交和角色对话平台。描述:vivo 推出的基于蓝心大模型的智能 AI 助手应用。描述:科大讯飞推出的认知智能大模型和 AI 聊天机器人。描述:月之暗面推出的支持超长上下文的 AI 聊天助手。描述:昆仑万维推出的大模型助手和 AI 搜索引擎。描述:美团旗下推出的 AI 聊天和虚拟社交软件。描述:微软推出的 AI 聊天机器人和对话助手。

2024-07-11 21:53:15 2072

原创 大模型日报 2024-07-11

洛桑联邦理工学院(EPFL)的Anne-Florence Bitbol团队提出了一种配对相互作用的蛋白质序列的方法。推出AI搜索为中心的一站式AI服务,提供从检索、创作、总结,到编辑、存储、分享的一体化信息服务价值。加拿大温莎大学研究人员对GPT和Meta AI的Llama在化学信息学领域的应用进行比较的研究。使用自回归条件扩散模型的动作生成框架,实现真实、带有语义、符合场景且无长度限制的动作生成。亚马逊云科技发布了一系列生成式AI技术,将大模型技术与企业用户需求连接起来。

2024-07-11 21:23:36 350

原创 大模型日报 2024-07-10

全新大语言模型架构 TTT 有望代替 Transformer 模型。以上是为您生成的 2024 年 7 月 10 日的大模型日报。首个半导体开源大模型 SemiKong 有望改变行业。介绍 NeRF 研究中消除瞬态干扰物影响的新方法。介绍大语言模型树搜索训练增强框架 TSLLM。介绍新型语言模型 Memory3 及其优势。快手旗下「可灵 AI」的升级及新功能。介绍隐私计算技术的发展和标准体系建设。分析 RAG 大模型的知识冲突问题。报道关于语言理解的神经元活动研究。为半导体行业带来变革。

2024-07-10 15:16:56 593

原创 大模型日报 2024-07-09

作者相信,这个研究了一年多的项目,将从根本上改变我们的语言模型方法。他们通过微调的方法将原本需要多个模型的复杂任务交给同一个LLM完成,实现了模型在RAG任务上的性能提升。RankRAG在多个基准测试上超过了同样基座上的其他微调模型,具有较高的实用性和新颖性。可灵AI在视频生成方面有了新的升级,拥有七大能力亮点,包括高画质的电影级画面生成、领先的图生视频能力、优秀的视频生成可控性、大幅度且合理的运动生成能力、分钟级的长视频生成能力、模拟复杂的物理世界特性以及概念组合和指令响应能力。

2024-07-10 00:21:25 349

原创 大模型日报 2024-07-08

Anthropic首席执行官表示,当前AI模型训练成本是10亿美元,未来三年,这个数字可能会上升到100亿美元甚至1000亿美元。哈佛大学与谷歌DeepMind人工智能实验室合作创造了一只搭载了AI大脑的「虚拟大鼠」,能够模仿真实啮齿动物的所有动作,开辟了「虚拟神经科学」新领域。介绍了一种针对长视频流的在线理解多模态大模型Flash-VStream,具有快速记忆重要信息和实时回答用户提问的能力。达摩院发布了一站式AI视频创作平台“寻光”,旨在提升AI视频创作的效率,提供了丰富的AI编辑功能。

2024-07-08 22:40:30 161

原创 大模型日报 2024-07-07

它的上下文窗口长度从 1M 增加到 2M,是目前主流大模型的最长上下文。本文介绍了在谷歌与 Founder Park 联合组织的线下 Workshop 上,AI 开发者和爱好者们对 Gemini 1.5 Pro 进行的上手体验,以及他们在 Google Cloud 项目实战中的经验。该算法通过多模态对比学习与联合示例选择的方式,从大型数据集中筛选出与学习最相关的子batch,以减少计算量和能源消耗。该模型可以快速理解50种语言并生成5种语言的语音,具有情感交互的功能。

2024-07-07 22:21:53 344

原创 WAIC热点聚焦|新质生产力与低空经济

新质生产力通常是指在新的经济社会发展阶段中,由于科技创新、产业升级、模式创新等因素驱动而形成的具有变革性和高增长潜力的生产能力。低空经济的发展需依赖于法律法规的完善、基础设施的升级、技术创新的推进,以及标准化和规范化管理的加强,同时解决好有人机与无人机的融合运行问题,以确保这一新兴产业的健康可持续发展。信号全覆盖的低空网络、数据接口、低空管控体系、统一标准且满足快速增长需求的起降场。包括运营企业的专业人才队伍建设、运营模式创新、以及应对紧急情况的能力等。:包括飞行服务、维修保养、培训、保险、租赁等。

2024-07-06 23:33:34 1144

原创 大模型日报 2024-07-06

思考决策能力通过第二代思考大模型 OmChat V2 提升,能支持多种复杂输入,在多个测试中性能行业前列。其 Infini-AI 云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,支持六种异构芯片的大模型混合训练。支付宝发布多模态医疗大模型,联合 20 家机构发起医疗 AI 共建计划。旨在推动 AI 在医疗领域的创新应用,通过多模态数据整合和分析,提供更准确、高效的医疗服务。采用医疗增强大模型,超越 GPT-4,对 AI 在医疗领域应用意义重大。

2024-07-06 22:57:51 343 1

原创 大模型日报 2024-07-05

讯飞星火 V4.0 在 WAIC 2024 展示最新应用成果,国产算力自主可控。实现全新 AI 交互模式,综合性能提升,推出“大模型 0 元 Go”计划。以上是为您生成的 2024 年 7 月 5 日的大模型日报。推出用于评估大语言模型时间推理能力的基准测试 ToT。盘古大模型 5.0 在多领域应用进展及升级情况。大模型日报 2024-07-05。

2024-07-05 22:05:44 599

原创 WAIC热点聚焦|具身智能简介:AI新浪潮的领跑者

在大模型技术的推动下,机器人响应语音指令成为现实,预示着AI领域的重大突破。具身智能作为AI领域的重要方向,正引领着技术创新和产业发展的新浪潮。随着技术的不断进步和市场的逐渐成熟,我们有理由相信,具身智能将为人类社会带来更多的可能性和价值。以其创新的人形机器人技术,成功吸引了来自科技巨头的6.75亿美元投资,估值高达26亿美元。面对技术、隐私和伦理等方面的挑战,具身智能的发展需要持续的创新和审慎的策略。,雅可比机器人的创始人,分享了他对于具身智能商业化落地的深刻见解。创业者的视角:雅可比机器人的探索。

2024-07-04 22:31:56 748

原创 大模型日报 2024-07-04

法国非营利性 AI 研究机构 Kyutai 开发的开源实时语音多模态模型 Moshi。接近 GPT-4o 水平,0 延迟实时互动,能处理多音频流,多种说话风格。涉及多家互联网大厂高管加入生成式 AI 创业,涵盖多个领域及融资情况。以上是为您整理的 2024 年 7 月 4 日的大模型日报。软硬一体加速,性能最高提升 6 倍,已应用于多项业务。从文本生成 3D 资产,不到一分钟,性能出色。莫纳什大学和格里菲斯大学研究人员开发的新框架。阐述全新技术主张及实现的技术路径。大模型日报 2024-07-04。

2024-07-04 22:09:08 381

原创 大模型日报 2024-07-03

Meta最新发布的3D Gen技术,通过Meta 3D AssetGen和Meta 3D TextureGen两个阶段,实现了从文本到3D资产的快速生成。AI编程助手兼容多种编程语言,能够生成代码、解释代码、注释代码和生成单测等。: 提出3D推理定位任务和ScanReason基准,设计ReGround3D方法,通过多模态大语言模型提升推理和定位效果,并验证其有效性。: BrainyAI在浏览器侧边栏提供GPT-4等顶尖AI模型的聊天、搜索和总结功能,提升生产力,免费替代Sider和Monica。

2024-07-03 22:33:17 827

原创 WAIC重磅发布|WAIC 2024最新活动日程安排完整发布!

会议涵盖 AI 伦理治理、大模型、具身智能、投融资、教育人才等重点话题,体现 AI 向善等价值导向,9 位大奖得主和 88 位国内外院士确认参会,共 200 余位重磅嘉宾将发表演讲。大会将展示一系列人工智能创新成果,包括大模型的广泛应用,如商汤科技、科大讯飞等企业的最新模型,以及智能机器人和AI驱动的新型终端设备。展会聚焦大模型、智能终端和应用赋能,500多家企业参展,其中一半以上来自市外和国际,涵盖医疗、金融、交通、教育等多个领域,揭示了人工智能对未来社会的深远影响。更多完整论坛日程安排如下,欢迎阅览~

2024-07-02 21:08:34 495

原创 大模型日报 2024-07-02

提出Auto Cherry-Picker框架,通过大语言模型生成布局和图像,使用CLIS评估,提升下游任务性能,尤其在长尾分布和不平衡数据集上表现显著。通过HireAI,快速匹配自由职业和全职远程工作,覆盖190个国家的35万+专家。: 本文提出ProgressGym框架,通过学习历史文本中的道德进步机制,解决AI系统中道德对齐的挑战,并提供基准测试和开放排行榜。: 提出一种利用大语言模型生成多样化合成数据的方法,介绍了包含十亿角色的Persona Hub,展示其在多种场景中的应用。

2024-07-02 20:53:39 643

原创 大模型日报 2024-07-01

DeepGlycanSite 将蛋白质的几何和进化特征融入具有 Transformer 架构的深度等变图神经网络中,其性能显著超越了之前的先进方法,并能有效预测各种糖类分子的结合位点。该研究的贡献包括提出了一种在句法树上使用扩散的全新方法,并在逆向图形任务中实现了该方法,发现其优于之前的方法。: 该文章介绍了华为诺亚方舟实验室的研究人员提出的一种基于树搜索的推理时间能力提升方法MindStar,该方法在数学问题上达到了近似闭源大模型GPT-3.5与Grok-1的推理能力。

2024-07-01 21:29:26 889

原创 大模型日报 2024-06-30

Briefy是一款AI知识助手,为专业用户简化每日信息消费,将复杂信息提炼成结构化摘要,组织成知识库,并以自然语言按需检索。: Claude Pro和Team用户可将聊天组织到可共享的项目中,结合内部知识和聊天活动,并可定制Claude的响应。将书名嵌入设计中,并从多种艺术风格中选择,完美匹配您的愿景。: Modelscope项目使用Python编写,旨在让用户享受扩散模型的魔力,提供强大的AI模型功能。: 利用AI大模型,该项目可以一键生成高清短视频,使用Python编写,简化了视频制作过程。

2024-06-30 20:43:43 286

原创 大模型日报 2024-06-29

Vmaker AI支持35+语言自动生成字幕,130+语言翻译,提供30+字幕样式和100+动画效果,支持上传srt文件和手动编辑。: 研究表明,通过删除和交换相邻层,大型语言模型在不进行微调的情况下仍能保持72-95%的预测准确性,并提出了推理的四个阶段。: NVIDIA推出适用于研究人员和开发者的生成式AI框架,支持大语言模型、多模态和语音AI,使用Python编写。: OMG-LLaVA结合像素级视觉理解与推理能力,支持多种视觉和文本提示,实现图像、对象和像素级别的推理与理解。

2024-06-29 23:38:56 574

原创 大模型日报 2024-06-27

字节跳动发布了一款名为“豆包MarsCode”的智能开发工具,此工具基于豆包大模型,旨在提供高效的开发环境和工具支持。: 研究大语言模型生成说服性文本的能力,构建Persuasive-Pairs数据集,训练模型预测文本对的说服性评分,并探讨不同系统提示对说服性的影响。: 本文提出VarBench,通过变量扰动方法动态生成测试用例,评估四个数据集上的大语言模型,解决数据泄露问题,提升评估准确性。: 研究提出了评估LLM心理属性的框架,涵盖人格、价值观、情绪等六大维度,揭示LLM自我报告与实际行为的差异。

2024-06-28 22:56:35 1002

原创 大模型日报 2024-06-28

谷歌发布了Gemini家族的新成员Gemma 2,提供了90亿和270亿参数的两个版本,具有卓越的性能和高效的推理能力。该模型以视觉为中心,探索了多种不同的视觉编码器及其组合,并设计了一种动态且可感知空间的新型连接器,将视觉特征与LLM整合在一起。: 本研究提出了一种基于大语言模型的创新评估方法,通过分析4407家上市公司年报,构建全面的数字化转型指标,发现数字化转型显著提升公司财务表现。: CharXiv提供2323个复杂图表,评估多模态大语言模型在图表理解中的表现,揭示现有模型的不足。

2024-06-27 23:10:21 1000

原创 大模型日报2024-06-26

2024-06-26。

2024-06-26 22:02:18 895

原创 大模型日报2024-06-25

2024-06-25。

2024-06-25 22:40:52 349

原创 大模型日报2024-06-24

2024-06-24。

2024-06-24 16:07:05 936

原创 大模型日报2024-06-23

2024-06-23。

2024-06-23 23:10:18 790

原创 大模型日报2024-06-22

2024-06-22。

2024-06-22 20:28:41 1214

The Global Generative AI Landscape 2024

Generative AI (GenAI)The Global GenerativeAILandscape2024AIport 2024最新 2024年全球生成人工智能全景图

2024-03-22

【论文原文】有效的转移和无监督的深度学习医学图像分析方法

有效的转移和无监督的深度学习医学图像分析方法 TowardsNovelMethodsforEffectiveTransferLearningand UnsupervisedDeepLearningforMedicalImageAnalysis (https://biblio.ugent.be/publication/8521037/file/8521039.pdf)

2019-10-12

java对打游戏

java课程的大作业,还在进一步完善中。能控制玩家跑动

2018-10-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除