阿里达摩院:GPT-4 vs 年薪60万的数据分析师,成本只占0.45%

阿里达摩院与南洋理工大学的论文显示,GPT-4在多数指标上可与6年经验的数据分析师媲美,其在生成SQL、Python代码、数据分析和图表制作方面表现出色。虽然在某些准确性上逊于人类,但速度和一致性更高,或将大幅降低数据分析师的成本。
摘要由CSDN通过智能技术生成

 Datawhale干货 

达摩院:GPT最新论文,来源:量子位

GPT-4替代初级数据分析师的成本只有0.71%,换成高级数据分析师则是0.45%……

你没看错,是百分之零点七一,不是百分之七十一。

e131980737ca3e4d6a7778b5cf908280.png

按新加坡行情,年薪8.6万-9万美元(60-63万人民币)的高级数据分析师,换成GPT-4就只需要三四百美元(2000多人民币)了。

这项结论来自阿里达摩院新加坡南洋理工大学的新论文,被网友评价为对AI和数据分析领域感兴趣的必读论文。

a4f7a7e21256a5461c8b2811206da9af.png

具体来说,结论中高级分析师指在金融行业拥有多年工作经验的数据分析师。

而GPT-4的表现,在大多数指标上能与一位6年工作经验的人类相当,正确性低于人类,但复杂性和一致性指标高于人类。

在与另一位5年工作经验的分析师对比中,GPT-4在信息的正确性、图表的美观性、洞察的复杂性等方面输给人类。

如果与2年工作经验的初级分析师对比,GPT-4在正确性上表现更好,而且能完成更多的工作。

2b7f6dd3d1f19de0cf2b22f1ee568e22.png

但GPT-4完成所有类型的任务都要比人类快得多。

在假设每个月有21个工作日,每天8小时工作时间,按市场价支付工资的前提下,得出最终结论。

2de4b3d420d17fb297cb7f069d735be7.png

GPT-4当数据分析师,都能干什么

论文重点考察了GPT-4作为数据分析师的以下几种能力:

  • 生成SQL和Python代码

  • 执行代码获得数据和图表

  • 从数据和外部知识源中分析数据,得出结论

fdb7c92679946914f6c68234d0fc0638.png

200个样本的实验表明,对于绘制图表任务,GPT-4能够理解指令含义,且对图表类型有一定背景知识,从而绘制出正确的图表。

图表大部分清晰可见,没有任何格式错误,图标的美观性指标满分3分,GPT-4平均得分2.73。

但手工检查还是能发现一些小错误,图表准确性指标满分1分,GPT-4平均得分0.78。

论文中特别说明他们的评估标准非常严格,只要x轴或y轴的任何数据或任何标签有错误,都要扣分。

4f003301e39a5080da5914f3fa177387.png

对于数据分析任务,GPT-4在一致性和流畅性中平均得到满分,验证了生成流畅且语法正确的句子对GPT-4来说绝对不是问题。

有意思的是,到了数据分析这一步的准确性要比图表信息的准确性高得多,说明尽管GPT-4画了错误的图表但分析出了正确的结论。

11da175cbc0c801e9da1aa66c4aac244.png

在案例分析中,研究团队还总结出三条GPT-4与人类数据分析师的主要区别:

  • 人类分析师可以用个人思想和情感来表达,比如在分析时写“令人惊讶的是……”;人类读者容易从这样的表述中理解数据是符合预期还是不正常的。

  • 人类分析师倾向于结合背景知识得出结论,如写到“……常见于……”;GPT-4通常只关注提取到的数据本身,允许GPT-4上网搜索实时在线信息可以改善这一点。

  • 当提供见解或建议时,人类分析师倾向于保守,如声明“假如数据没有问题的话……”;GPT-4会以自信的语气直接给出建议,不会提及假设。

另外团队表示,由于预算有限,主要是雇一个来与GPT-4对比的高级分析师太贵了,人工评估和数据标注的数量相对较少。

论文:https://arxiv.org/abs/2305.15038

59eb043db8f47b8f1855492831673e9f.png

一起赞”三连

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值