大模型日报
2024-06-13
大模型资讯
- 摘要: 大规模语言模型(LLMs)在各个领域取得了显著成功,但集中训练需要大量数据。FedLLM-Bench提供了一个联邦学习基准测试,旨在解决这一问题。
- 摘要: 科学家发现,强大的AI——GPT-4在心理理论测试中的表现几乎与人类相当甚至更好。然而,它在某些社交方面仍存在困难。
- 摘要: 一项新研究使用认知心理学测试来检验大型语言模型(LLMs)的合理性。研究发现,LLMs能够展示出某些方面的认知能力,但结果也揭示了一些意想不到的发现。
- 摘要: 阿里巴巴推出最新多语言模型Qwen2,显著提升多语言处理能力,挑战当前最先进的模型Llama 3。
- 摘要: 阿布扎比的技术创新研究院(TII)于5月14日发布了其下一系列的Falcon语言模型。新模型具备先进的技术能力,为语言处理领域带来新的突破。
- 摘要: MIT研究人员开发了一种新技术,通过语言输入为机器人规划路径。这种方法虽然不能超越基于视觉的导航技术,但展示了语言模型在机器人导航中的潜力。
- 摘要: 2024年6月11日,谷歌的杰出工程师兼健康技术负责人Shwetak Patel和谷歌研究部首席工程师Shravya Shetty宣布,利用人工智能推进个人健康与保健洞察的发展。
- 摘要: Slack工程团队利用大型语言模型(LLM),结合抽象语法树(AST),成功自动转换了15000个单元和集成测试中的80%。
- 摘要: Inspectus是一个开源的大型语言模型注意力可视化库,旨在帮助理解大型语言模型的工作原理及其关注点,从而提高其性能。
- 摘要: Meta公司希望利用隐私意识强烈的欧洲用户数据来训练其人工智能模型,但这一举动引发了隐私方面的担忧。
大模型产品
- 摘要: TeamCreate提供多功能AI员工,适用于财务、销售等多种角色。可通过Slack部署,支持200+应用,任务管理无缝对接。
- 摘要: Zeacon通过AI视频营销,持续吸引、互动和转化网站访客,简化营销流程,提升网站效果。
- 摘要: Namify AI提供品牌名生成、商标检查、域名检查、用户名检查,并赠送免费logo,助您轻松创建品牌。
- 摘要: Invisibility整合GPT-4o、Claude 3 Opus、Gemini和Llama 3,只需按Option+Space即可调用,无需截图或复制粘贴。
- 摘要: Autodesigner 2.0结合ChatGPT对话流和Uizard生成UI,提供易用的UI设计生成器,快速将创意转化为数字产品概念。
- 摘要: Review Raven是Blursday推出的AI助手,能快速分析Figma设计并提供高质量反馈,助你更智能更高效地设计。
- 摘要: Onboard利用先进的AI技术,解决了客户管理和邮件发送的复杂问题,让每位客户的主要收件箱不再错过重要信息。
- 摘要: 通过Quest的In-App SDKs,营销团队无需开发、数据或设计团队,轻松实现AI驱动的用户界面个性化。
- 摘要: Omi是为财务和运营团队设计的AI文件管理平台,集中管理合同,提醒续约和操作事项,轻松搜索与协作。
大模型论文
- 摘要: 本文提出Commonsense-T2I任务和基准,评估T2I模型生成符合常识的图像能力。实验发现现有模型表现欠佳,旨在推动真实图像生成技术进步。
- 摘要: 提出Open-LLM-Leaderboard,通过开放式问题评估LLM性能,解决选择偏差和随机猜测问题,并提供代码和数据集。
- 摘要: 本文提出了SIG3D模型,解决3D视觉语言推理中的情境感知问题,通过在SQA3D和ScanQA数据集上的实验,显著提升了情境估计和问答性能。
- 摘要: 提出了一种新的视觉模型预训练方法——潜在压缩学习,通过最大化因果注意模型输入输出间的互信息,利用交错图文数据进行预训练,展示了其在视觉表示学习中的潜力。
- 摘要: QuickLLaMA通过查询感知推理系统提升LLMs处理长序列的能力,无需额外训练,显著提升准确率。
- 摘要: 研究表明,通过反馈增强的合成数据训练大型语言模型可以防止模型崩溃。理论和实验验证了该方法在矩阵特征值计算和新闻摘要中的有效性。
- 摘要: 本文介绍了THaLLE的金融分析扩展,使用8B LLM在CFA模拟考试中表现最佳,并提供细调技术和Flare CFA数据集。
- 摘要: 本文提出图像文本化框架,利用多模态大模型和视觉专家模型协作,自动生成高质量图像描述,并提出多个基准进行评估。
- 摘要: TextGrad利用LLM提供的文本反馈优化AI系统组件,适用于多种任务,提升了GPT-4o等模型的性能和应用效果。
- 摘要: 本文综述2019-2024年对话摘要生成的主要挑战及对应技术,分析评估方法和数据集,探讨未来研究方向。
大模型开源项目
- 摘要: LeRobot是一个使用Pytorch实现的端到端现实世界机器人学习项目,旨在通过深度学习提升机器人性能。
- 摘要: 使用TypeScript将小爱音箱接入ChatGPT和豆包,改造成个性化的专属语音助手,实现智能对话功能。
- 摘要: Apple是一个用Python编写的可扩展深度学习库,旨在提供灵活和强大的深度学习解决方案。
- 摘要: Karpathy项目是一个用Python编写的库,旨在提供最简单、最快速的方式来训练或微调中型GPT模型。
- 摘要: Xenova项目实现了在浏览器中直接运行先进的机器学习模型,无需服务器支持,使用JavaScript编写。
- 摘要: Litestar是一个生产级、轻量、灵活且可扩展的ASGI API框架,使用Python编写,帮助开发者轻松构建高性能API。
- 摘要: Coqui-AI是一个用Python编写的深度学习文本转语音工具包,已在研究和生产中经过实战测试。