前提:有conda,创建一个虚拟环境,并开启
第一步,配置环境
下载相关的库
conda install numpy
conda install pandas
如图则是安装成功
第二步:在jupyter中试运行
注意:jupyter要在虚拟环境启动之后安装,麻烦小一点,我用了Ipython,没有内核问题,出现在终端下载好相关库但是在jupyter总运行一直报错的,大概率是内核问题,建议用IPython
第三步:下载数据集
第四步:开始学习
跟着Datawhale学的,目的为了打卡,以下为具体任务,部分没放
任务一、二
任务三
在数据分析中,先看数据集行列内容,来具体分析接下来应该怎么做。
除了从数据集本身出发以外,还可以通过数学方式,eg:平均值,计算中位数等方式;
我们还可以将数据可视化制作成图表的形式,比如matplotlib。
eg:
计算平均年龄,提取年龄那一行进行计算