小编在之前的论文写作流程中,介绍了大量论文文字工作,今天小编使用Excel表格数据集,给宝子们演示一下ChatGPT如何助力论文论证过程中的数据分析。
一篇令人信服的学位论文,应当有新颖、适当的论证视角,选择恰当的研究方法,搭建逻辑严密、平衡的论证框架,把具有说服力的数据分析紧密结合起来,这样一篇论文将具有逻辑严密的论证过程。
1.数据介绍
首先介绍一下数据集,数据集我在Kaggle上下载了一个房价预测的数据集。具体使用到的有两个文件。
-------------------------------------------------------
其中[data_description.txt]文件主要是对数据集中每一列的描述。
-------------------------------------------------------
[train.csv]就是今天案例所用到的数据集了。
2.特征工程
AI论文,免费大纲,10分钟3万字
我们先让ChatGPT对数据做一下特征工程。
特征工程(Feature Engineering)是数据预处理和机器学习领域中的一个重要步骤。它涉及到从原始数据中选择、修改和创建新的特征(即数据的属性或变量),以便更好地适应机器学习算法的需求,并最终提高模型的性能。特征工程的主要目的是使原始数据集更适合用于建模和分析。
提示词:
根据data_description.txt对数据集的描述
对 Train.csv进行特征工程
ChatGPT反馈:
3.EDA分析
让ChatGPT对数据做Exploratory data analysis (探索性数据分析)。
探索性数据分析(Exploratory Data Analysis,简称EDA)是数据分析的一种方法论,它侧重于使用各种技术来大致理解数据集的主要特征。这个过程通常是数据分析项目的初步步骤,旨在通过摘要和可视化手段来发现数据的模式、异常、关键变量和潜在的关系。
提示词:
根据特征工程后的数据,对数据集进行 Exploratory data analysis (探索性数据分析)
ChatGPT反馈:
4.数据相关性
AI论文,免费大纲,10分钟3万字
AIPaperPass - AI论文指导平台www.aipaperpass.com?pic=mLnw
最后我们让ChatGPT对数据集中对房价影响最大的15种数据进行相关性分析。
提示词:
提取对房屋销售价格影响最高的15个特征做相关性分析。
ChatGPT反馈:
5.进行总结
最后我们让ChatGPT对分析过程做一个总结。ChatGPT做数据分析也相当简单,而且生成的图表也可直接用于论文辅佐论点的论证!