评估 ChatGPT 的数据分析改进:交互式表格和图表

ChatGPT 会成为一种 BI 工具吗?

         欢迎来到雲闪世界。2024 年 5 月,随着 GPT-4o 的激动人心的发布,OpenAI 宣布对 ChatGPT 中的数据分析进行改进,包括提供交互式表格和图表,以及与 Google Drive 和 Microsoft OneDrive 的集成。 在本文中,我将评估这些新功能并展望使用 ChatGPT 进行数据分析的未来。

添加图片注释,不超过 140 字(可选)

ChatGPT 数据分析简史 ChatGPT 进军数据分析的旅程始于 2023 年 3 月推出的代码解释器,并于 2023 年 7 月向 Plus 用户推出。 后来,OpenAI 将其重新命名为 Advanced Data Analysis,然后是 Data Analysis,现在是Data Analyst,作为官方 GPT 之一。今天,你可以使用这个独立的 Data Analyst GPT 或直接使用提示 ChatGPT 来执行数据分析功能。

添加图片注释,不超过 140 字(可选)

OpenAI 一直在不断改进这些功能。值得注意的是,它于 2024 年 5 月宣布改进 ChatGPT 中的数据分析,增强了与表格和图表交互的能力。 评估最近的聊天GPT数据分析增强功能 尽管它提供了快速而合乎逻辑的分析,但我得出的结论是,由于数据准备、数据科学专业知识和业务知识方面的差距,ChatGPT 尚未准备好取代熟练的数据科学家。 在本节中,我将评估最新功能:与 ChatGPT 中的表格和图表进行交互。 1. 加载和预览数据集 让我们从一个实际的例子开始。我将使用Kaggle上一家电子商务公司的交易数据集(CC0 许可证)。假设我是一名销售经理,希望分析此数据集以识别销售增长机会。这是我的提示:

 
 

### 背景 我是一家英国电子商务(在线零售)公司的销售经理。 这家位于伦敦的商店自 2007 年以来一直通过网站销售成人和儿童礼品和家居用品。 他们的客户来自世界各地,通常直接为自己购买。 还有一些小企业批量购买并通过零售店渠道卖给其他客户。 ### 数据集 我有一个一年的销售交易数据集。 该数据集包含 500K 行和 8 列。 以下是每列的描述。 - TransactionNo(分类):定义每笔交易的六位唯一编号。代码中的字母“C”表示取消。 - 日期(数字):生成每笔交易的日期。 - ProductNo(分类):用于标识特定产品的五位或六位唯一字符。 - 产品(分类):产品/物品名称。 - 价格(数字):每件产品每单位的价格,以英镑(£)为单位。 - 数量(数字):每笔交易每种产品的数量。与取消的交易相关的负值。 - CustomerNo(分类):定义每个客户的五位唯一数字。 - Country(分类):客户所在国家/地区的名称。 数据集中有一小部分订单取消。 这些取消大部分是由于某些产品缺货。 在这种情况下,客户倾向于取消订单,因为他们希望一次性交付所有产品。 ### 目标 我的目标是使用此数据集来获取见解并制定销售策略以推动销售增长。 您今天正在协助我分析这个数据集。 请帮我加载数据集。

以前,将数据集上传到 ChatGPT 只会显示一个文件图标。但现在,ChatGPT 创建了一个交互式表格,您可以将其展开到全屏视图以更仔细地查看数据。它还提供建议提示,引导您更深入地了解数据。

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

此外,您现在可以从 Google Drive 或 Microsoft OneDrive 上传数据文件到 ChatGPT,从而使文件管理和共享更加容易,尤其是对于团队或企业用户而言。

添加图片注释,不超过 140 字(可选)

2. 生成和自定义可视化 接下来,让我们问一个简单但重要的问题:“分析每月的销售趋势”。ChatGPT 生成了一个简单的折线图,我可以扩展它并与之交互。 首先,当您将鼠标悬停在点上时,它会在工具提示中显示值。

添加图片注释,不超过 140 字(可选)

其次,您可以通过单击右上角的设置图标来更改线条颜色,并使用您喜欢的配色方案轻松下载 PNG 格式的图表。

添加图片注释,不超过 140 字(可选)

但是,并非所有可视化类型都受支持。例如,我要求 ChatGPT 在一张图表中绘制月销售额和交易数量。它正确生成了图表,但不是交互式格式。 “目前,大多数情况下只有条形图、饼图、散点图和折线图具有交互性。ChatGPT 可以生成多种非交互式图表,包括:直方图、散点图、箱线图 (Box-and-Whisker Plots)、热图、面积图、雷达图、树形图、气泡图和瀑布图。”

尽管折线图被列为受支持的类型,但更复杂或更细微的折线图(例如带有两个轴)仍然保持静态。

图片

图片上传失败

​重试

3. 观察和参考表格 现在让我们尝试与表格交互。我展开了 ChatGPT 计算的月度销售和交易表,单击第 12 行,并要求 ChatGPT 调查 11 月份的销售激增情况。这是我们在查看业务指标时常见的数据问题。您可以看到聊天中引用了“第 12 行”,这有助于 ChatGPT 了解上下文。它合理地回应了 11 月份最畅销产品的列表及其对激增的假设。

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

您还可以选择一组单元格。例如,我选择了排名前 10 位的产品,并要求 ChatGPT 显示它们的月度销售趋势,以查看它们是否都在 11 月出现了销售高峰。ChatGPT 捕获了 10 种产品的列表,并提供了它们的月度趋势和见解。

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

交互式表格和图表的用例 上面我们测试了 ChatGPT 中与表格和图表交互的新功能。我认为,这次更新主要针对非数据专业人士,降低他们进行数据分析的门槛。

  1. 效率:用户现在可以使用交互式表格以更像 Excel 的方式探索数据,但效率提高了 10 倍。在我的示例中,在 Excel 中创建月度销售趋势图表需要几个步骤 - 创建一个计算销售额(数量 x 价格)的新列,透视表格以按月计算总销售额,然后生成折线图。但现在,您只需与 ChatGPT 交谈即可完成此操作。

  2. 引导分析:建议的提示充当数据分析助手,在用户不确定下一步该怎么做时引导他们更深入地探索数据。

  3. 演示用的视觉效果:自定义可视化功能使非技术利益相关者更容易准备演示用的数据证据来支持他们的业务决策。

ChatGPT 数据分析的发展方向是什么? 那么,您对这些更新有何感想?老实说,尽管取得了进步,但我发现当前的交互有些受限,感觉像是未来更新的 MVP。从字里行间,我感觉 OpenAI 正在瞄准一些雄心勃勃的目标。这是我的大胆猜测:OpenAI 可能正在构建基于对话的商业智能 (BI) 工具。 以下是一些线索:

  1. 产品演进:识别何时输出交互式表格/图表的基础工作已经完成,扩展这些功能是下一个合乎逻辑的步骤。如果他们就此止步,然后说:“是的,线条/条形的颜色是你唯一可以改变的东西。”那我会感到惊讶。😂 受到他们目前提供的产品的启发,我希望 ChatGPT 支持更多交互式图表类型;我希望我可以进一步自定义图表(标题、轴标签、图例等);我希望我可以直接在图表上选择一个数据点并在聊天中引用它来提问和进行深入分析;我希望我可以直接格式化表格单元格…… 写完所有这些想法后,我意识到我正在设想一个 BI 工具!

  2. 目标用例:在新发布页面的“ChatGPT 中的数据分析工作原理”段落中,OpenAI 表示“这让初学者更容易进行深入分析,并节省专家在常规数据清理任务上的时间。 ” 因此,他们当前的目标用例是数据清理和初步探索性数据分析 (EDA),这些都得到了 Looker 和 Tableau(当然还有 Excel)等 BI 工具的大力支持。这表明他们有可能进入 BI 领域。

  3. 目标用户:新功能将使那些不是数据专家但需要基本数据探索或演示图表的业务利益相关者受益。每个数据团队都梦想着让他们的业务利益相关者能够自助服务。利益相关者今天与数据的交互通常涉及用于探索数据集和创建可视化和仪表板的 BI 工具。然而,他们的主要挑战是正确理解数据并以正确的方式探索数据以回答他们的业务问题。这些是 ChatGPT 的优势,并使其比现有的 BI 工具更具优势。

  4. 功能名称更改:我可能过度解读了,但有趣的是他们多次重命名此功能(代码解释器 -> 高级数据分析 -> 数据分析/数据分析师)。这一进展表明,他们在寻找产品市场契合度和潜在盈利机会时,关注点发生了转变。我的理论是:最初,当他们发现基于人工智能的数据科学的潜力时,他们将“高级数据分析”与“代码解释器”分开。后来,他们意识到让它在数据科学中更“先进”具有挑战性,但市场对聊天机器人有更广泛的需求,它可以充当数据分析师,协助进行日常数据探索和报告。那么数据分析师是做什么的呢?今天,他们花费大量时间在 BI 工具中构建仪表板,以便为利益相关者报告和监控指标。因此,要让 ChatGPT 成为数据分析师,扩展其 BI 功能是有意义的。

作为 BI 工具面临的挑战 但当然,用 ChatGPT 构建一个功能齐全的 BI 工具面临着几个挑战:

  1. 准确性:我们都知道 ChatGPT 会犯错误。然而,在商业环境中,特别是对于数据知识很少的商业用户来说,提供准确可信的信息至关重要。在上面的例子中,为了计算月销售额,我不得不要求它Sales = Price x Quantity首先创建一个新的列。当我要求它直接绘制月度销售趋势时,它有时会将价格列相加,有时会将数量列相加。虽然我能够发现问题并通过额外的步骤来纠正它,但你不能总是指望利益相关者这样做。

  2. 稳定性:ChatGPT 的输出可能不一致。我发现 ChatGPT 输出交互式图表/表格与静态图表/表格时会令人困惑……为了制作上述屏幕截图,我在同一数据集上至少有六个 ChatGPT 线程,并且使用不同的提示。

  3. 数据大小限制:“最多可以向给定对话上传 10 个文件”,文件大小限制为“每个文件 512 MB”。对于 CSV 文件或电子表格,文件大小不能超过大约 50MB,具体取决于每行的大小。” 现实世界的数据集很容易超过此大小限制。

  4. 短会话:当我返回昨天的聊天时,我无法再查看表格,并显示错误消息“无法显示可视化”。在商业设置中,重新访问和继续探索数据集的能力至关重要,可能是受到新商业理念的启发,或者想要解决后续问题。

添加图片注释,不超过 140 字(可选)

结论 总结一下,ChatGPT 近期推出的交互式表格和图表功能主要针对非数据专业人士,让数据分析变得更加简单高效。用户可以在建议提示的引导下,以可视化的方式与数据进行交互,并根据自己的展示需求自定义可视化效果。 这一发展甚至可以为强大的基于对话的 BI 工具铺平道路,使业务利益相关者在基本数据探索和报告方面更加自助。 您尝试过 ChatGPT 中的新数据分析功能吗?在下面的评论中分享您的经验,并让我知道您对我的理论的想法。

感谢关注雲闪世界。(Aws解决方案架构师vs开发人员&GCP解决方案架构师vs开发人员)

  • 15
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值