
数据分析
文章平均质量分 85
会开车的凉拖鞋
这个作者很懒,什么都没留下…
展开
-
第二章 第四节 数据可视化
**复习:**回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。 2 第二章:数据可视化 开始之前,导入numpy、pandas以及matplotlib包和数据原创 2021-07-06 00:17:54 · 317 阅读 · 0 评论 -
第二章 第三节 数据重构2
复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。 开始之前,导入numpy、pandas包和数据 导入基本库 import numpy as np import pandas as pd 载入上一个任务人保存的文件中:result.csv,并查看这个文件 df = pd.read_c原创 2021-06-20 01:05:37 · 99 阅读 · 0 评论 -
第二章 第二节 数据重构1
复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。 开始之前,导入numpy、pandas包和数据 导入基本库 import numpy as np import pandas as pd 载入data文件中的:train-left-up.csv df = pd.read_csv(r'原创 2021-06-20 01:03:25 · 107 阅读 · 0 评论 -
第一章 第三节 Pandas 排序和describe()函数查看数据统计信息
复习:在前面我们已经学习了Pandas基础,知道利用Pandas读取csv数据的增删查改,今天我们要学习的就是探索性数据分析,主要介绍如何利用Pandas进行排序、算术计算以及计算描述函数describe()的使用。 1 第一章:探索性数据分析 开始之前,导入numpy、pandas包和数据 #加载所需的库 import numpy as np import pandas as pd #载入之前保存的train_chinese.csv数据,关于泰坦尼克号的任务,我们就使用这个数据 df = pd.read原创 2021-06-15 22:21:37 · 3012 阅读 · 0 评论 -
第一章 第二节 数据筛查和删除
复习:数据分析的第一步,加载数据我们已经学习完毕了。当数据展现在我们面前的时候,我们所要做的第一步就是认识他,今天我们要学习的就是了解字段含义以及初步观察数据。 1 第一章:数据载入及初步观察 1.4 知道你的数据叫什么 我们学习pandas的基础操作,那么上一节通过pandas加载之后的数据,其数据类型是什么呢? 开始前导入numpy和pandas import numpy as np import pandas as pd 1.4.1 任务一:pandas中有两个数据类型DateFrame和Serie原创 2021-06-15 22:14:29 · 405 阅读 · 0 评论 -
第一章 第一节 数据载入
复习:这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上泰坦尼克的任务,实战数据分析全流程。 这里有两份资料: 教材《Python for Data Analysis》和 baidu.com & google.com(善用搜索引擎) 1 第一章:数据载入及初步观察 1.1 载入数据 数据集下载 https://www.kaggle.com/c/titanic/o原创 2021-06-15 22:05:08 · 292 阅读 · 1 评论