大模型日报2024-05-26

大模型日报

 

2024-05-26

 

大模型资讯

 

  1. AI助力揭示海洋和肠道中的病毒活动

 

  • 摘要: 病毒在微生物生态系统中是神秘且难以理解的力量。研究人员发现,病毒可以感染、杀死并操控人类。AI技术有望帮助我们更好地了解这些病毒在海洋和肠道中的行为。

 

  1. 微软推出Windows Copilot Runtime,提升AI体验

 

  • 摘要: 微软发布Windows Copilot Runtime,为开发者提供在Windows上访问Phi Silica等AI工具的能力,旨在提升人工智能应用的开发和使用体验。

 

  1. 先进AI在心理视角测试中超越人类

 

  • 摘要: 一支由心理学家和神经生物学家组成的团队发现,AI在理解他人心理方面展现了令人惊讶的新技能,在心理视角测试中表现优于人类。

 

  1. MIT研究人员提出跨层注意力机制,优化Transformer架构

 

  • 摘要: MIT研究人员提出了一种名为跨层注意力(CLA)的新方法,通过在各层之间共享键值激活,减少了Transformer架构中键值缓存的大小,从而缓解了大语言模型在服务时的内存瓶颈问题。

 

  1. 未来公司在JSAI2024展示未来主义AI应用

 

  • 摘要: 未来公司将在JSAI2024展会上展示其前沿的AI应用,探讨AI与社会的融合。这家总部位于东京的知名咨询集团致力于改变未来社会的景观。

 

  1. OpenAI新产品或具讽刺检测功能

 

  • 摘要: 据报道,OpenAI可能在周一发布一款新的多模态AI助手。该技术理论上可以帮助自动化客户服务,包括检测讽刺语气。

 

  1. 人工智能揭示植物的秘密生活

 

  • 摘要: 通过人工智能技术,更详细地了解植物及其与外界的互动,有助于育种者开发出更具韧性的作物,并帮助农民进行更有效的规划。

 

  1. Elia:用于与大型语言模型交互的开源终端界面

 

  • 摘要: Elia 是一个开源的终端用户界面,专为与大型语言模型(LLMs)交互而设计。它为需要快速高效地使用这些强大工具的用户提供了便利。

 

  1. 亚马逊CTO:AI或能解决最难问题

 

  • 摘要: 亚马逊首席技术官沃纳·沃格尔斯表示,人工智能可能解决一些最棘手的问题。尽管亚马逊没有像OpenAI或谷歌那样的大型语言模型,但他仍对AI的潜力充满信心。

 

大模型产品

 

  1. Sendi:AI CRM营销助手

 

  • 摘要: Sendi,一款AI驱动的CRM营销平台,助你一键创建并发送超个性化通知。告别繁琐的A/B测试,让AI来为你个性化定制营销信息,迈入CRM营销的新时代。

 

  1. AutoChat®: WhatsApp自动化平台

 

  • 摘要: AutoChat®是一款先进的WhatsApp商业自动化云平台。它提供强大的自动化功能,帮助企业高效运营,实现商业目标。

 

  1. Alchemyze: AI股票评级和市场洞察

 

  • 摘要: Alchemyze是一个基于机器学习的股市研究工具,为4000多支股票提供全面评级。通过对500多个特征与历史数据的分析,提供易于理解的投资决策信息。

 

  1. Voxpad:AI视频音频智能笔记

 

  • 摘要: Voxpad利用AI技术将视频和音频内容转换成详细笔记。用户可自定义笔记风格、格式和语气,并通过智能块编辑器进行编辑和保存,还支持AI自动补全。提供基于令牌系统的订阅计划,以获取额外使用小时。

 

  1. BuilderKit.ai SaaS落地页模板

 

  • 摘要: BuilderKit.ai推出10款精美SaaS落地页。提供可编辑的Figma文件和可直接部署的代码,助力您快速发布AI SaaS产品。

 

  1. Tapmention:Reddit提及转化客户工具

 

  • 摘要: Tapmention是一款专注于Reddit的营销工具,能够通过关键词追踪提及,帮助用户发现潜在客户和进行市场研究,同时利用AI技术自动回复,提升转化率。

 

大模型论文

 

  1. 跨域对齐揭示大型语言模型的人类思维模式

 

  • 摘要: 本文借鉴认知科学任务,评估大型语言模型的概念化和推理能力。通过行为研究,分析模型对跨域映射任务的响应,并比较其推理解释与人类的相似性。

 

  1. Bitune: 双向指令微调方法

 

  • 摘要: Bitune是一种改良预训练解码器模型的方法,通过结合因果和双向注意力机制来提升指令理解能力,显著提高下游任务表现。

 

  1. PV调优:极限压缩LLM的新方法

 

  • 摘要: 本文提出PV调优框架,对大型语言模型(LLMs)进行极限压缩。与传统的直通估计器(STE)相比,PV调优在1-2比特参数量化上取得更优性能,实现了Llama 2模型族的Pareto最优量化。

 

  1. HippoRAG:仿生记忆增强语言模型

 

  • 摘要: 本文提出了HippoRAG,一个受到人类海马体记忆理论启发的检索框架,旨在提升大型语言模型在整合新信息时的效率和深度。研究表明,HippoRAG在多跳问答任务上超越了现有技术,代码和数据已开源。

 

  1. 大型语言模型解决长数学题研究

 

  • 摘要: 本研究首次探索大型语言模型(LLMs)解决长篇幅数学文字题(MWPs)的能力,提出新的评估指标和方法,改善了LLMs在处理复杂实际问题上的性能和泛化能力。

 

  1. 语言模型可复现评估经验教训

 

  • 摘要: 本文总结了评估大型语言模型的三年经验,探讨了评估中的挑战,并提出了最佳实践。介绍了开源库lm-eval,旨在提高评估的独立性、可复现性和扩展性。

 

  1. WISE:大型语言模型终身编辑

 

  • 摘要: 本文提出WISE框架,通过双参数记忆体系解决大型语言模型终身编辑中的可靠性、泛化性和局部性三角难题。主记忆存储预训练知识,侧记忆用于编辑知识,通过路由器决定查询路径。实验表明WISE在多项任务上超越现有方法。

 

  1. FinRobot:金融应用AI开源平台

 

  • 摘要: 本文介绍了FinRobot,一个开源的金融AI代理平台。它通过大型语言模型(LLMs)支持多个金融专用AI代理,旨在促进AI在金融决策中的广泛应用。

 

  1. 大型语言模型在公共卫生任务中的评估

 

  • 摘要: 研究评估了大型语言模型在公共卫生领域的分类和信息提取任务中的应用效果。通过分析13个数据集,发现Llama-3-70B-Instruct模型在大多数任务中表现最佳,而GPT-4的表现与之相当。结果表明这些模型对公共卫生专家有潜在的辅助价值。

 

  1. 大型语言模型用于时间序列异常检测

 

  • 摘要: 本文提出了sigllm框架,探究大型语言模型(LLMs)在时间序列异常检测任务中的效能。通过时间序列到文本转换及端到端提示方法,比较了基于提示的检测与预测引导检测两种范式。结果显示,预测方法在11个数据集上的F1得分显著优于提示方法,但与最先进深度学习模型相比,性能仍有30%的差距。

 

大模型开源项目

 

  1. CodiumAI:智能测试生成工具

 

  • 摘要: CodiumAI Cover-Agent 是一个用Python编写的AI工具,能够自动化生成测试,并提升代码覆盖率,旨在帮助开发者更高效地发现并修复代码中的bug。

 

  1. khoj-ai:智能问答辅助大脑

 

  • 摘要: khoj-ai是一个AI问答辅助工具,旨在通过强大的语言模型(如gpt4或llama3)来帮助用户从个人笔记或互联网中获取答案。支持本地部署或云服务,可通过多种平台访问,包括Obsidian、Emacs、桌面应用、网页或Whatsapp。项目使用Python编写。

 

  1. Perplexica:开源AI搜索引擎

 

  • 摘要: ItzCrazyKns开发的Perplexica是一个AI驱动的搜索引擎,旨在成为Perplexity AI的开源替代品。项目使用TypeScript语言编写,为开发者提供了一个自由的搜索引擎框架。

 

  1. 深入大型语言模型课程项目

 

  • 摘要: mlabonne项目是一门专注于大型语言模型(LLMs)的课程,提供了学习路线图和Colab笔记本,使用Jupyter Notebook语言编写。

 

  1. OpenBMB:手机上的GPT-4级多模态模型

 

  • 摘要: OpenBMB项目推出了MiniCPM-Llama3-V 2.5,这是一个可在手机上运行的GPT-4级别的多模态大型语言模型(LLM),使用Python语言编写,致力于提供高效能的AI体验。

 

  1. W01fh4cker:Confluence后台RCE漏洞

 

  • 摘要: W01fh4cker是一个用Python编写的AI项目,针对CVE-2024-21683,即Confluence的认证后远程代码执行(RCE)漏洞进行研究和利用

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值