大模型日报
2024-06-01
大模型资讯
- 摘要: AutoCoder在2024年4月的评估中,以90.9%的pass@1成绩超越了GPT-4 Turbo和GPT-4o,成为首个在人类评估基准测试中取得最高分的大型语言模型。
- 摘要: MBZUAI发布大型语言模型K2-65B,全球首发,设立可持续性能新标准。该模型成本效益高,旨在推动知识共享、基础研究和技术发展,为全球科技进步做出贡献。
- 摘要: 自然语言处理(NLP)在机器翻译、情感分析和对话代理等方面有广泛应用。超小型语言模型(STLMs)的出现,为NLP领域带来了可持续发展的新变革。
- 摘要: OpenAI宣布推出GPT-4 Turbo,现已向付费ChatGPT用户开放。该公司在X(前身为Twitter)上分享了这一消息,表示其大型语言模型已更新至GPT-4 Turbo版本。
- 摘要: 香港理工大学研究表明,增强人工智能大型语言模型(LLMs)有助于更好地与人类大脑活动对齐。随着生成式人工智能(GenAI)近年来改变社交互动格局,此发现具有重要意义。
- 摘要: 腾讯发布了元宝AI聊天机器人,旨在缩小与百度和字节跳动的差距。元宝可以用于分析和总结文档、提供问答服务,并生成文本和图像。
- 摘要: 大型语言模型引导的动态适应方法(LLM-DA)是一种用于时序知识图谱(TKGs)推理的机器学习方法。该方法利用大型语言模型的能力,动态调整和优化推理过程,从而提高时序知识图谱的推理性能和准确性。
- 摘要: 穆罕默德·本·扎耶德人工智能大学发布了大型语言模型K2-65B。K2在透明度和性能方面为开源人工智能设立了新的标准。
- 摘要: Inflection更新了其Pi聊天机器人。行业专家表示,这些小型AI模型具有优势,可以提升商业的可及性和应用范围。
- 摘要: Core42公司宣布其最新的阿拉伯语大语言模型现已在微软Azure平台上可用。Core42是G42旗下公司,提供全方位的AI赋能解决方案。
大模型产品
- 摘要: OH, a potato! 是一款AI驱动的iOS应用,通过使用现有食材来帮助你发现、保存和计划食谱,减少食物浪费。
- 摘要: Graphite AI SEO平台通过主题优化提升流量和收入,区别于关键词解决方案,全面满足用户需求。
- 摘要: AI笔记应用,智能管理文本、图片、音频、PDF和YouTube视频链接,提供强大笔记体验,轻松提问与保存。
- 摘要: AR2R是AI助手,结合自然语言处理、AI工具和人性化服务,帮助企业家轻松掌握会议相关工作。
- 摘要: BypassAI帮助内容创作者、营销人员和企业绕过AI过滤器,调整内容以传达信息而不改变其含义。
- 摘要: Eve是你的AI压力教练,结合好友的温暖和生活教练的智慧,随时倾听和共情,助你应对职场压力。
- 摘要: Ask Elle帮助青少年找到匹配对象,并通过有趣、安全的方式指导他们约会。与Elle的虚拟形象对话,获取即时建议。
- 摘要: 使用DocentPro探索周围和世界的深度故事,享受多语言AI音频解说。免费获取全球见解,发现、学习并连接世界。
大模型论文
- 摘要: 本研究提出MotionLLM,通过视频和运动序列联合建模,实现人类行为理解、描述和推理,并引入新数据集MoVid和评估基准MoVid-Bench。
- 摘要: 本文提出了一种新的参数空间对齐范式,通过视觉编码器将视觉信息转换为感知权重,减少输入序列长度,提高效率。
- 摘要: 介绍了RapVerse数据集,并提出通过多模态变换器从歌词生成同步的3D全身动作和说唱声音的新方法。
- 摘要: Xwin-LM提出了一套全面的对齐方法,包括监督微调、奖励模型、拒绝采样微调和直接偏好优化,显著提升了LLMs的性能。
- 摘要: ParSEL系统通过自然语言控制高质量3D资产编辑,结合LLM和AEP算法,实现精确可控的形状变换。
- 摘要: CausalQuest收集了13,500个自然因果问题,通过人工和大语言模型标注,训练出高性能分类器,未来研究方向丰富。
- 摘要: ANAH数据集提供大语言模型生成问答中的幻觉细粒度注释,包含~12k句子级别注释,覆盖700多个话题。
- 摘要: FoldFlow-2 利用氨基酸序列的生物偏好,结合多模态融合和几何变换解码器,在大规模数据集上表现优异。
- 摘要: 本文探讨了大语言模型在WebArena基准上通过自我改进提升长期任务表现的方法,任务完成率提高31%。
- 摘要: 本文介绍了PlausiVL,一个大规模视频语言模型,通过引入两种目标函数来学习和生成合理的动作序列,并在Ego4D和EPIC-Kitchens-100数据集上验证了其有效性。
大模型开源项目
- 摘要: ChatTTS是一种生成语音模型,专用于日常对话。项目使用Jupyter Notebook语言编写,适合AI语音生成研究。
- 摘要: V-Express项目生成受参考图像、音频和V-Kps图像序列控制的说话头视频,使用Python语言编写。
- 摘要: iyaja是一个自组织文件系统,基于llama 3技术开发,使用Jupyter Notebook语言编写,提升文件管理效率。
- 摘要: Fabric是一个开源框架,通过AI增强人类能力。它提供模块化框架,使用Python编写,解决特定问题。
- 摘要: MLflow是一个用Python编写的开源平台,专注于管理机器学习生命周期的各个阶段,包括实验跟踪、模型管理和部署。
- 摘要: MusePose是一个基于姿态驱动的图像到视频生成框架,使用Python编写,能够生成虚拟人视频。
- 摘要: ViViD项目利用扩散模型实现视频虚拟试穿功能,提供高效且逼真的试穿体验,助力电商和时尚行业。
- 摘要: TrueFoundry推出的RAG框架,使用Python语言构建模块化、开源的生产应用程序。
- 摘要: Webprodigies是一个用TypeScript编写的AI聊天机器人,能像销售代表一样与客户互动。
- 摘要: 微软发布了一个名为Agentic AI的编程框架,主要使用Jupyter Notebook语言编写,提供了详细的开发路线图和Discord社区支持