数据分析如何正确使用ChatGPT进行辅助?

90 篇文章 0 订阅
73 篇文章 0 订阅

目录

1.数据介绍

2.特征工程

3.EDA分析

4.数据相关性分析

5.分析总结


        一篇优秀的学术论文,肯定有新颖、适当的论证视角,选择恰当的研究方法,搭建逻辑严密、平衡的论证框架,把有力的数据分析紧密结合起来,这样一篇论文将具有逻辑严密的论证过程。小编在之前的AI工具论文写作流程中,介绍了大量论文文字工作,今天小编使用Kaggle数据,给大家分享一下学术论文中数据分析相关内容使用Kimi的效果。

图片

1.数据介绍

        首先介绍一下数据集,数据集我在Kaggle上下载了一个房价预测的数据集。具体使用到的有两个文件。

图片

-------------------------------------------------------

其中[data_description.txt]文件主要是对数据集中每一列的描述。

图片

-------------------------------------------------------

[train.csv]就是今天案例所用到的数据集了。

图片

2.特征工程

        我们先让Kimi对数据做一下特征工程。

        特征工程(Feature Engineering)是数据预处理和机器学习领域中的一个重要步骤。它涉及到从原始数据中选择、修改和创建新的特征(即数据的属性或变量),以便更好地适应机器学习算法的需求,并最终提高模型的性能。特征工程的主要目的是使原始数据集更适合用于建模和分析。

提示词:

根据data_description.txt对数据集的描述

Train.csv进行特征工程

图片

ChatGPT反馈:

图片

3.EDA分析

        让ChatGPT对数据做Exploratory data analysis (探索性数据分析)。

        探索性数据分析(Exploratory Data Analysis,简称EDA)是数据分析的一种方法论,它侧重于使用各种技术来大致理解数据集的主要特征。这个过程通常是数据分析项目的初步步骤,旨在通过摘要和可视化手段来发现数据的模式、异常、关键变量和潜在的关系。

提示词:

根据特征工程后的数据,对数据集进行Exploratory data analysis (探索性数据分析)

图片

ChatGPT反馈:

图片

图片

4.数据相关性分析

最后我们让ChatGPT对数据集中对房价影响最大的15种数据进行相关性分析。

提示词:

提取对房屋销售价格影响最高的15个特征做相关性分析。

图片

ChatGPT反馈:

图片

图片

5.分析总结

        最后我们让ChatGPT对分析过程做一个总结。ChatGPT做数据分析也相当简单,而且生成的图表也可直接用于论文辅佐论点的论证!

提示词:

站在一个[数据分析师]的角度 对上述分析过程做一个总结。

图片

ChatGPT反馈:

图片

图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIWritePaper官方账号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值