机器学习数据科学包(十三)——Matplotlib模块:散点图、线形图、柱状图、直方图、饼图、箱型图

​​​​

散点图

  • 散点图显示两组数据的值,每个点的坐标位置由变量的值决定
  • 由一组不连接的点完成,用于观察两种变量的相关性
  • 例如身高-体重、温度-维度、等等

绘图语法

plt.scatter([1,2,3,4],[1,2,3,4])

不相关

正相关

负相关

样式选择

plt.scatter(x,y,s=点面积,c=颜色,alpha=透明度,marker=形状)

实例:判断股票市场前一天的涨幅对今天涨幅是否有影响

获取第二列开盘价与第五列收盘价。

画图结果说明前一天涨幅跟下一天涨幅没有明显关系

折线图

  • 折线图是用直线段将各数据连接起来组成的图形
  • 常用来观察数据随时间变化的趋势
  • 例如股票价格、温度变化等等

绘图语法

plt.plot(x,y)

样式选择

  • 线型linestyle
  • 颜色 color
  • 点形状 marker

实例:以日期为x轴画出股市开盘价折线图

将第一列识别成日期。

纵坐标不是日期,计算机自动将日期解析成一系列字符串,使用plot_date绘制带日期的

默认散点图

改变样式

条形图

  • 以长方形的长度为变量的统计图表
  • 用来比较多个项目分类的数据大小
  • 通常利用于较小的数据集分析
  • 例如不同季度的销量,不同国家的人口等

绘图语法

plt.bar(x,y,width=,color=,align='center|edge')  # 绘制条形图
plt.barh(x,y,width=,color=)  # 绘制水平条线图

直方图

  • 由一系列高度不等的纵向条形组成,标书数据分布情况
  • 例如某年级同学的身高分布情况
  • 主要和条形图区别

绘图语法

plt.hist(x, 段数, density=False)   # 一个变量的直方图

plt.hist2d(x1, x2, 段数)  # 两个变量的直方图

饼状图

  • 饼状图显示一个数据系列中各项的大小与各总项的比例
  • 饼状图中的数据点显示为整个饼状图的百分比
  • 如前十大品牌占市场份额图

绘图语法

plt.pie(数据列表,标签列表,autopct=False,explode=突出列表,shadow=False)

箱型图

  • 箱型图又称为盒须图、盒式图或箱线图
  • 是一种用作显示一组数据分散情况资料的统计图
  • 异常值,上边缘,上四分位数,中位数,下四分位数,下边缘,异常值

绘图语法

plt.boxplot(x,whis=1.5,sym=None)

其中whis表示上边缘和下边缘的长度,sym为异常点的形状

 

负相关

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值