Chatgpt 最近可是火出了圈,今天我们来分享如何使用 chatgpt 来减轻数据分析师的工作。
我已打包好ChatGPT的安装包和学习教程,需要可以微信扫描下方CSDN官方认证二维码 即可领取↓↓↓
数据可视化
在执行探索性数据分析时,用 Python 快速生成可视化图,通常可以帮助我更好地理解数据集。
不幸的是,这项任务可能会变得非常耗时—尤其是当你不知道如何使用正确的语法来获得所需结果时。
我经常发现自己在搜索 Seaborn 的大量文档并使用 StackOverflow 生成单个 Python 图。
让我们看看 ChatGPT 是否可以帮助解决这个问题。
这里我们使用的数据集是来自 kaggle 上的 Pima Indians Diabetes。
下载数据后,让我们使用 Pandas 进行读取并显示。
ini复制代码import pandas as pd
df = pd.read_csv('diabetes.csv')
df.head()
该数据集中有九个变量。其中 “Outcome” 变量是告诉我们一个人是否会患上糖尿病的目标变量。其余的是用于预测结果的自变量。
好的!所以我想看看这些变量中的哪些变量会影响一个人是否会患上糖尿病。
为实现这一点,我们可以创建一个聚类条形图来查看。
这实际上很容易编写出来,但让我们从简单的开始。随着文章的进展,我们将转向更复杂的提示。
现在,让我们输入以下提示以使用糖尿病数据集生成可视化。
下面是 chatgpt 生成的完整代码片段。
ini复制代码import seaborn as sns
import pandas as pd
# 读取数据
df = pd.read_csv("data.csv")
# 绘制聚类条形图
sns.catplot(x="variable", y="value",hue="Outcome",
data=pd.melt(df, id_vars=["Outcome"]),
kind="bar", height=4, aspect=2)
把数据集的名称换一下,就真的生成了我们想要的图。
这张图表看起来很完美!这正是我在 ChatGPT 中输入提示时的设想。
然而,一个突出的问题是该图表上的文本重叠。
我将通过键入以下提示询问模型是否可以帮助我们解决此问题:
生成的图形中 x 轴的标签有重叠,我们如何修改它呢
这看起来很棒!
通过简单地查看此图表,我现在可以更好地理解数据集。似乎葡萄糖和胰岛素水平较高的人更容易患上糖尿病。
读者福利:知道你对Python感兴趣,便准备了这套python学习资料
对于0基础小白入门:
如果你是零基础小白,想快速入门Python是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!
零基础Python学习资源介绍
- ① Python所有方向的学习路线图,清楚各个方向要学什么东西
- ② 600多节Python课程视频,涵盖必备基础、爬虫和数据分析
- ③ 100多个Python实战案例,含50个超大型项目详解,学习不再是只会理论
- ④ 20款主流手游迫解 爬虫手游逆行迫解教程包
- ⑤ 爬虫与反爬虫攻防教程包,含15个大型网站迫解
- ⑥ 爬虫APP逆向实战教程包,含45项绝密技术详解
- ⑦ 超300本Python电子好书,从入门到高阶应有尽有
- ⑧ 华为出品独家Python漫画教程,手机也能学习
- ⑨ 历年互联网企业Python面试真题,复习时非常方便
👉Python学习路线汇总👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
👉Python必备开发工具👈
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉Python学习视频600合集👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉实战案例👈
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉100道Python练习题👈
检查学习结果。
👉面试刷题👈
👉python副业兼职与全职路线👈
上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码 即可领取↓↓↓