大模型日报2024-04-19

大模型日报

 

2024-04-19

 

大模型资讯

 

  1. Meta AI发布开源语言模型透明度工具

 

  • 摘要: Meta AI推出了一款名为Large Language Model Transparency Tool (LLM-TT) 的开源交互式工具包,旨在分析基于Transformer的语言模型。该工具能够协助研究人员和开发者更好地理解和评估这些先进的语言处理系统。

 

  1. GPT-4在眼科护理场景中超越初级医生

 

  • 摘要: 剑桥大学领导的一项研究发现,大型语言模型GPT-4在眼科护理场景中的表现接近专业眼科医生的水平。这表明人工智能在医疗健康领域的应用潜力巨大,能够在某些方面辅助或部分替代专业医疗人员的工作。

 

  1. 人工智能领域的大型语言模型迅速进步

 

  • 摘要: 随着技术的快速发展,大型语言模型在短短18个月内取得了显著的进步。OpenAI发布的ChatGPT聊天机器人,曾经引起广泛关注的技术,现已迅速成为人工智能领域的常态。这一变化反映了人工智能技术更新换代的高速度。

 

  1. LoReFT:面向语言模型的参数高效微调技术

 

  • 摘要: 最新研究提出了LoReFT技术,这是一种参数高效的微调方法(PeFT),旨在通过只更新少量权重来适应大型语言模型。该方法能够在不牺牲性能的前提下,有效减少模型调整过程中所需的资源和时间。

 

  1. 韩国初创公司Upstage AI获7200万美元B轮融资,旨在为企业打造定制化大型语言模型

 

  • 摘要: 韩国初创企业Upstage AI在其B轮融资中成功筹集到7200万美元资金。该公司计划利用这笔资金开发专为企业定制的大型语言模型,以满足不同行业对智能语言处理技术的需求。这标志着人工智能领域的一个新的投资亮点,也显示出定制化大型语言模型的市场潜力。

 

  1. AI在眼病诊断准确性上超越医生

 

  • 摘要: 一项由某大学领导的研究表明,GPT-4在临床知识和推理技能方面正接近专业眼科医生的水平。这项研究显示,在准确评估眼部问题方面,AI已经能够胜过医生,预示着人工智能在医疗诊断领域的潜力和发展。

 

  1. Reka AI推出多模态语言模型,挑战谷歌Gemini

 

  • 摘要: Reka AI公司宣布,由一名新加坡人和一名印尼人共同创立的该公司最新推出的Reka Core多模态语言模型在视频处理方面超越了谷歌的Gemini Ultra。Reka AI的这一突破可能会在人工智能领域引起重大关注。

 

  1. AI2发布OLMo 1.7-7B更新,带来更广泛数据集和改进的训练方法

 

  • 摘要: AI2最近更新了其开源语言模型OLMo至1.7-7B版本,此次更新包括了新的Dolma 1.7数据集和一个两阶段的训练课程。这一更新旨在通过更大规模和多样性的数据集,以及更有效的训练策略,进一步提升模型的性能和泛化能力。

 

  1. LoRA技术:打造个性化的精细调校语言模型

 

  • 摘要: 最新消息指出,现在你可以利用LoRA技术自己构建一个精细调校的大型语言模型(LLM)。LoRA为那些已经体验过ChatGPT、Claude等先进语言模型的用户提供了一个新的选择。通过LoRA,用户可以根据自己的需求和偏好,打造专属的语言模型,开启个性化的人工智能体验。

 

  1. MIT工程师利用大型语言模型赋予家用机器人常识

 

  • 摘要: 麻省理工学院的工程师们利用大型语言模型的帮助,使家用机器人在出现错误后能够自我纠正并继续完成家务任务。这项技术的进步意味着机器人在执行任务时能够更加独立地处理突发状况,提高了它们的自主性和效率。

 

大模型产品

 

  1. Pullpo.io: Slack中的快速AI代码审查

 

  • 摘要: Pullpo.io通过AI加速代码审查,实现Slack与GitHub实时同步,帮助开发团队将代码审查时间从数天缩短到数小时。

 

  1. SpeedLegal:智能合同谈判助手

 

  • 摘要: SpeedLegal是一款AI工具,旨在帮助用户更好地理解和协商合同。它能迅速识别合同风险,用简单语言解释复杂法律术语,并提供个性化改进建议。

 

  1. Collato AI:智能会议记录助手

 

  • 摘要: Collato AI Notetaker能将会议记录、图片和音频转化为文档。注册免费账户,邀请ally@collato.com参加Google Meet,Collato将自动完成记录工作,让你专注于更重要的事情。

 

  1. superwhisper iOS版:智能语音转文本

 

  • 摘要: superwhisper为iOS用户提供精准的AI语音识别功能。无论是散步时记录想法、会议摘要还是快速口述邮件,该应用都能以用户的风格准确转写文本,提高沟通效率。

 

  1. Prompt Fuzzer:保护AI应用安全工具

 

  • 摘要: Prompt Fuzzer是一个开源工具,旨在评估并增强你的生成式AI(GenAI)应用的安全性。通过模拟动态LLM攻击,该工具对系统提示的安全性进行检查,并提供评估报告,帮助你改进并加固系统提示功能。

 

  1. Pic Copilot 2.0:电商AI设计利器

 

  • 摘要: Pic Copilot 2.0利用AI技术,为电商提供创新视觉营销解决方案。新版增加多项功能,让电商设计变得简单、有创意且高效。

 

  1. Cascadeur 2.0:AI动画编辑工具

 

  • 摘要: Cascadeur 2.0推出动画解烘焙功能,利用AI技术简化编辑过程。无论是动作捕捉数据、资产还是生成的动画,均能自动识别关键帧并优化插值。

 

  1. SermoAI:金融领域的语言助手

 

  • 摘要: SermoAI是一款AI驱动的助手,专为银行和金融科技公司设计,能够以客户的母语提供全面的客户支持。它基于银行业务查询进行特别训练,符合银行隐私法规,是现代化的AI银行文员。

 

  1. Zoom Workplace:AI驱动的协作平台

 

  • 摘要: Zoom Workplace是一个集通讯、员工参与、空间和生产力解决方案于一体的平台,融合了Zoom AI Companion功能,旨在重新定义团队合作方式。

 

  1. Tabula:AI加速的创业数据分析工具

 

  • 摘要: Tabula是一款AI驱动的数据分析工具,帮助初创企业集中数据管理并自动化生成报告。无需招聘数据工程师即可定制和扩展分析能力。

 

大模型论文

 

  1. VG4D:结合视觉语言模型的4D视频识别

 

  • 摘要: 本文提出了VG4D框架,将视觉语言模型(VLM)知识迁移到4D点云网络,通过对齐4D编码器与VLM的表示,学习共享视觉文本空间,改进了动态点云骨干网络,提升了动作识别性能。

 

  1. 基于LLMs的自动化代码修复研究

 

  • 摘要: 本研究深入探讨了大型语言模型(LLMs)在自动化程序修复(APR)中的应用。提出了Toggle框架,实现了从识别代码错误位置到修复的全流程,刷新了CodeXGLUE代码细化基准的最新记录。

 

  1. LLMTune:用大型语言模型加速数据库调优

 

  • 摘要: LLMTune是一个基于大型语言模型的数据库配置生成器,能为新工作负载产生初始高质量配置,显著加快优化器的调优过程。通过自动化数据生成框架训练,实验表明LLMTune在多种工作负载下有效性高,如TPC-H工作负载下加速比达到15.6倍。

 

  1. 分子图GNNs的可扩展性研究

 

  • 摘要: 本研究探讨了图神经网络(GNNs)的扩展行为,通过分析最大的2D分子图数据集,证实了模型和数据集规模增加对GNNs性能的显著提升,为药物发现领域奠定了基础。

 

  1. MoA:个性化图像生成的注意力混合

 

  • 摘要: 本文提出了一种新的个性化文本到图像扩散模型架构,名为混合注意力(MoA)。MoA通过两条注意力路径分配生成任务,实现了主题与上下文的更好解耦,并提供了优质的个性化图像创作能力。

 

  1. 量化大型语言模型的多语言性能

 

  • 摘要: 本文提出了LanguageRanker工具,旨在基准测试和排名大型语言模型(LLMs)在不同语言上的性能。研究发现LLMs在所有语言的性能排名大致相同,且与训练语料的比例强相关。

 

  1. IoT云系统压力测试的精简框架

 

  • 摘要: 本文提出了一个为IoT云系统压力测试而设计的精简模拟框架,通过开发IoTECS领域特定语言,实现了高效模拟大量IoT与边缘设备。实验证明,IoTECS生成的模拟器性能优越,节省时间与资源。

 

  1. 新型神经手语生成方法:选择与重排

 

  • 摘要: 本文提出了一种新颖的手语翻译方法“选择与重排”(S&R),通过分解为词汇选择和词序重排两步,利用非自回归解码,显著提高了翻译的准确度和速度,尤其在资源有限的情况下,实现了更有效的手语翻译模型。

 

  1. LLM融合:基于困惑度的测试时优化

 

  • 摘要: 本研究提出PackLLM方法,通过优化算法在测试时融合多个大型语言模型(LLMs),以最小化输入提示的困惑度,实现模型专业知识的有效结合,显著提升任务性能。

 

  1. 隐私权在CSS与AI研究中的嵌入

 

  • 摘要: 本文探讨了在计算社会科学、人工智能和数据科学研究中保护隐私的重要性,分析了隐私问题及研究者在研究设计、数据收集、分析和成果传播过程中应考虑的关键事项。

 

大模型开源项目

 

  1. binary-husky:多功能LLM交互接口

 

  • 摘要: binary-husky项目,旨在为GPT/GLM等大型语言模型提供易用交互界面,强化论文处理能力。支持模块化自定义功能,多语言代码解析,以及多模型并行查询,集成多种AI服务。

 

  1. Mini-Gemini官方实现

 

  • 摘要: dvlab-research的Github Trending AI项目,名为Mini-Gemini,是其官方实现代码。该项目使用Python语言编写,涉及深度学习和人工智能领域的最新研究。

 

  1. Anthropics项目:探索Claude用例

 

  • 摘要: Anthropics是一个Github上的AI趋势项目,包含了一系列Jupyter Notebook文件。这些笔记本展示了使用Claude的一些有趣且有效的方法。

 

  1. 1Panel-dev:AI知识库问答系统

 

  • 摘要: 1Panel-dev是一个开源的AI问答系统,基于LLM大语言模型,能够迅速集成至第三方服务,由1Panel官方提供,使用Python编写。

 

  1. 斯坦福Oval项目:智能知识整合

 

  • 摘要: 斯坦福Oval是一个由大型语言模型(LLM)驱动的知识整合系统,能自动研究特定话题并生成带引用的全面报告。项目使用HTML编写。

 

  1. OpenTalker:单图像语音驱动面部动画

 

  • 摘要: OpenTalker是一个CVPR 2023项目,名为SadTalker,旨在通过学习真实的3D动作系数,实现风格化音频驱动的单图像说话面部动画。该项目使用Python编写。

 

  • 24
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值