自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 跟着Datawhale动手学数据分析5

很快,这次数据分析的实战项目就到了建模与评估的环节,也是数据分析最重要的部分——输出结果。文章目录对数据分析中常用的库进行回顾标题对数据分析中常用的库进行回顾import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom IPython.display import ImagePandas 是一个高性能、易使用的数据结构与数据分析库,主要适用于处理以下类型的数据:与

2020-08-28 19:40:25 189

原创 跟着Datawhale动手学数据分析4

文章目录数据可视化最基本的可视化图案有哪些?数据可视化最基本的可视化图案有哪些?柱形图展示多个分类的数据变化和同类别各变量之间的比较情况。 适用:对比分类数据。 局限:分类过多则无法展示数据特点。条形图类似柱状图,只不过两根轴对调了一下。适用:类别名称过长,将有大量空白位置标示每个类别的名称。 局限:分类过多则无法展示数据特点 。折线图展示数据随时间或有序类别的波动情况的趋势变化。适用:有序的类别,比如时间。 局限:无序的类别无法展示数据特点。柱线图

2020-08-25 19:33:08 260

原创 跟着Datawhale动手学数据分析 3

跟着Datawhale动手学数据分析 3文章目录跟着Datawhale动手学数据分析 3

2020-08-23 15:37:54 174

原创 跟着Datawhale动手学数据分析2

跟着Datawhale动手学数据分析2数据清洗及特征处理掌握基本操作以后,还需要进行数据清洗以及数据的特征处理,数据重构以及数据可视化。查看缺失值#判断列有无缺失值df.isnull().any()#查看具体缺失值个数df.Age.isnull().sum()处理缺失值dropna函数:移除有缺失值的行fillna函数:将缺失值填为0df.dropna().head(10)df.fillna(0).head(10)直接将对应缺失值更改为具体数值:df[df['Age']==N

2020-08-20 09:29:33 187

原创 跟着Datawhale动手学数据分析

跟着Datawhale动手学数据分析环境搭建由于之前用过Python处理科学计算,所以这次就直接用之前安装过的Anaconda了,在学习群里第一次学到Windows系统下在文件目录中用“shift”+“ctrl”+“右键”打开“Power shell”,再打开jupyter notebook。之前都是在默认路径下载入ipynb文件。。。数据载入本次学习的数据是泰坦尼克号的乘员信息,来源于kaggle,上面有许多用于机器学习的数据,看来是个值得收藏的宝库。接下来是载入数据。#相对路径df = p

2020-08-19 10:02:27 374

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除