数据科学库(HM)——第一节数据分析介绍&matplotlib

目录

数据分析

定义:

为什么要学数据分析?

数据分析的流程

matplotlib

为什么学习matplotlib

matplotlib折线图的实现

练习题:


数据分析

定义:

数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动

为什么要学数据分析?

  1. python数据科学的基础(包含pandas、numpy、matplotlib等python库)
  2. 机器学习课程的基础

数据分析的流程

  1. 提出问题
  2. 准备数据
  3. 整理、分析数据
  4. 获得结论
  5. 成果可视化

matplotlib

matplotlib最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建

为什么学习matplotlib

  • 能将数据进行可视化,更直观的呈现
  • 是数据更加客观、更有说服力

matplotlib折线图的实现

#coding=utf-8
from matplotlib import pyplot as plt   #导入pyplot模块
#import matplotlib.pyplot asplt      另一种导入pyplot模块的方法

import random    #导入随机数模块
import matplotlib

plt.figure(figsize=(20,8),dpi=80)    #设置图片大小
'''1.figure图形图标的意思,在这里指的是我们绘制的图
   2.通过实例化一个figure并且传递参数,能够在后台自动使用该figure实例
   3.在图像模糊的时候可以传入dpi参数,让图像更加清晰'''

#设置显示中文字体
from matplotlib import font_manager
my_font = font_manager.FontProperties(fname=r"D:\anaconda\Lib\site-packages\matplotlib\mpl-data\fonts\ttf\msyh.ttc")


x=range(120)      #在x轴的位置,是一个可迭代的对象,生成[0,119]范围内的120个整数
y=[random.randint(20,35)for i in range(120)]  #random.randint(20,35):生成范围在(20,35)之间的随机数整数
#x轴和y轴的数据一起组成了所有要绘制的坐标点

plt.plot(x,y)    #传入x,y通过plot绘制出折线图

#设置x轴上字符串的刻度
_x_ticks=["10点{}分" .format(i) for i in x if i<60]+["11点{}分" .format(i-60) for i in x if i>60]
#x轴表示10点-12点每一分钟的时刻数

plt.xticks(x[::5],_x_ticks[::5],rotation=45,FontProperties=my_font)   #rotation设置旋转的角度
#设置步长(数字和字符串一一对应),数据的长度一样

#添加描述信息
plt.xlabel("时间",FontProperties=my_font)
plt.ylabel("温度 单位(°C)",FontProperties=my_font)
plt.title("十点到十二点每分钟的气温变化情况",FontProperties=my_font)
#显示中文的地方都需要传入FontProperties参数

plt.savefig("./t1.png")   #保存图片在当前目录下

plt.show()  #展示图形

效果图:

练习题:

假设大家在30岁的时候,根据自己的实际情况,统计出来了你和你同桌各自11岁到30岁每年交的女()朋友的数量如列表ab,在一个图中绘制出该数据的折线图,以便比较自己和同桌20年间的差异,同时分析每年交女()朋友的数量走势

a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1],b=[1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1

要求:

    y轴表示个数

    x轴表示岁数,比如11,12岁一直到30岁等

from matplotlib import pyplot as plt
import matplotlib

#设置显示中文字体
from matplotlib import font_manager
my_font = font_manager.FontProperties(fname=r"D:\anaconda\Lib\site-packages\matplotlib\mpl-data\fonts\ttf\msyh.ttc")

plt.figure(figsize=(20,8),dpi=80)    #设置图片大小

a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]

x=range(11,31)
plt.plot(x,a,label="自己",linestyle="--",color="red",alpha=0.5)
plt.plot(x,b,label="同桌",linestyle="-",color="orange",alpha=0.5)
#->通过label指定显示的图例内容

_x_ticks=["{}岁" .format(i) for i in x ]
#x轴表示11-30岁的年龄段

plt.xticks(x,_x_ticks,rotation=45,FontProperties=my_font)   #rotation设置旋转的角度

plt.legend(prop=my_font,loc="best")
#->通过prop指定图例的字体
#->通过loc指定图例的位置,默认右上角

plt.show()

效果图:

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值