微软野心再现:对Excel和谷歌Sheet下手了!

1bc6a7c68ebe3919c4f07315d82ff10f.png

架构师大咖

架构师大咖,打造有价值的架构师交流平台。分享架构师干货、教程、课程、资讯。架构师大咖,每日推送。

公众号

该公众号已被封禁

微软团队在办公领域有着很强的“AI霸者”的野心。

近日,微软最新公布的研究论文,正在计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型--SpreadsheetLLM。

f78615983598efb7187ac3e22c0f2de5.png

研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。

b6437a5cc6f859ddc9b724346c87031f.jpeg

而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。

论文摘要部分,SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合。

2576d8519725419dd9535b3b0ab81eec.jpeg

SpreadsheetLLM 大大提高了电子表格表检测任务的性能,在 GPT4 的情境学习设置中,比普通方法高出 25.6%;使用词元(token)的成本降低了 96%,并能提供更好的处理结果。

论文指出,这种电子表格LLM框架,显著提高了LLM解释和利用电子表格的方式。但还有很多改进的空间,比如这种方法没有利用电子表格格式的细节,如背景颜色和边框,因为它们需要太多的标记(这些元素通常包含有价值的上下文和视觉线索,可以进一步深化模型对电子表格数据的理解和处理)。

此外,虽然SheetCompressor有效地聚合了数据区域,但它目前没有对包含自然语言的单元格采用复杂的基于语义的压缩方法。例如,将“中国”、“美国”和“法国”等术语归入“国家”等统一标签下,不仅可以提高压缩比,还可以加深LLM对数据的语义理解。探索这些先进的语义压缩技术将是我们持续努力增强SpreadsheetLLM功能的一个关键重点。

目前还没有关于微软计划何时或是否向公众提供 SpreadsheetLLM 的消息。

参考链接:https://arxiv.org/html/2407.09025v1

3efd2d35ba3b9ff145ab21c7175ed405.png

Python入门到精通

Python入门到精通:人生苦短,我用Python!Python每日推送、Python教程、Python资料、Python视频、Python项目、Python学习等。

公众号

该公众号已被封禁

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值