Datawhale
文章平均质量分 82
jyyym
记录
展开
-
Datawhale动手学数据分析Task04
第二章:数据可视化 1、matplot初见 1.1 最基本的可视化图案有哪些?分别适用于那些场景? 最基本的可视化图有折线图,柱状图,饼图,散点图,直方图等, 折线图适用于观察某个值的走势, 柱状图适用于观察不同条件的对比, 饼图适用于分析组成成分或者比例; 散点图用于描述数据的分布情况。 1.2 Figure&Subplot matplotlib的图像都位于Figure对象中,可以用plt.figure创建一个新的Figure fig = plt.figure() 不能通过空Figure绘图,应原创 2021-07-19 12:06:20 · 228 阅读 · 1 评论 -
Datawhale动手学数据分析Task03
1. 第二章:数据重构 1.1 数据的合并 数据的合并任务主要通过pandas中的concat、merge方法或是DataFrame的join、append方法来完成。 其中pandas.concat可以沿着一条轴将多个对象堆叠到一起,其参数设置如下: pandas.merge()方法是基于值的连接 1.2 数据聚合与运算 本节主要是对于Groupby机制的理解: 分组运算主要包括三个阶段的操作:split-apply-combine。 分组运算的第一个阶段,pandas对象(无论是Series、DataF原创 2021-07-17 10:39:43 · 152 阅读 · 0 评论 -
DataWhale动手学数据分析Task02
1. 第二章:数据清洗及特征处理 我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的样子。 1.1 缺失值观察与处理 1.1.1 任务一:缺失值观察 对于数据缺失值的观察主要可以通过pandas中的两个函数来完成,分别是isnull和isna(两个函数没有区别),并且通过与sum的组合可以计算出每列中缺失值的总和、比原创 2021-07-15 10:56:42 · 144 阅读 · 0 评论 -
DataWhale动手学数据分析Task01
DataWhale动手学数据分析Task01 1.第一章:数据载入及初步观察 1.1.1 载入数据 1、两种数据格式的区分及读取方式: TSV CSV Tab-Seperated Values Comma-Seperated Values 利用制表符作为字段值的分隔符 利用半角逗号作为字段值的分隔符 pd.read_table(‘path’) pd.read_csv(‘path’) 2、pandas中用于读取数据的常用函数及参数: import pandas as pd pd.r原创 2021-07-13 17:08:54 · 302 阅读 · 0 评论