数据分析-第一节
文章目录
数据分析概览
第一部分 综述
1、为什么要学习数据分析
我们通过对数据的统计、处理和分析,能够挖掘出数据背后的潜在信息,从而使我们能够快速把握本质,进行科学客观准确的决策。数据分析在现实中拥有众多的岗位需求,同时我们要学习的三个科学库,是python数据科学的基础,也是机器学习课程的基础。
2、什么是数据分析
数据分析是使用适合的方法来对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动
数据分析的流程
提出问题-准备数据-分析数据-获得结果-结果可视化
3、环境安装
安装anaconda
4、认识jupyter notebook
是一个交互式笔记本,支持40多种语言
第二部分 matplotlib
1、什么是matplotlib
是最流行的python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建
2、matplotlib基本要点
每个红色的点是坐标,把5个点的坐标连接成一条线,组成了一个折线图
那么到底如何把它通过代码画出来呢?
通过下面的小例子我们来看一下matplotlib该如何去使用,例题:假设一天中每隔两个小时(range(2,26,2))的气温(℃)分别是[15,13,14.5,17,20,25,26,26,27,22,18,15]
# 导入模块和包
from matplotlib import pyplot as plt
# 录入坐标
x = range(2,26,2)
# 数据在x轴的位置,是一个可迭代对象
y = [15,13,14,17,20,1,26,26,24,22,18,15]
# 数据在y轴的位置,是一个可迭代对象
plt