Intermediate Python

本文介绍了Python中的数据可视化基础,包括使用matplotlib进行图表绘制,并探讨了如何使用字典存储和操作数据。接着深入讲解了Pandas库,特别是DataFrame的创建、索引和选择数据,以及loc和iloc的用法。
摘要由CSDN通过智能技术生成

写在前面

       嗨呀,又到了更新的一天。翻看了前面两次的博客,发现阅读量确实没有写KNN来的多且快。看着阅读量还是挺有成就感的,所以在督促自己不断学习更新新的Python学习部分吖,早日完成基础部分的写作,提高文章的阅读量嘿哈~

       先列个大致的提纲,今天的文章主要包括两部分:

  • Visualize 可视化
  • store data in new data structures 也就是学习Python新的数据类型 DataFrame

Data Visualization

       这部分讲解一下Python中比较基础的可视化方法,更加进阶的可视化方法暂时还没有学到,不过在R语言中我学习过echart4r程辑包中的可视化方法,我认为这个比R自带的ggplot2更加优秀~据我所知echart在Python中也有接口,感兴趣的同学们可以自行了解一下。
       可视化有许多程序包,但一般来说它们的源头都是matplotlib,所以第一步当然需要载入程序包,然后再进行一系列的操作。

import matplotlib.pyplot as plt #这里用到的是pyplot模块
year=[1950,1970,1990,2010]
pop=[2.519,3.692,5.263,6.972]
#折线图
plt.plot(year,pop)
plt.show()
#散点图
plt.scatter(year,pop)
plt.show()
#气泡图
weight=[0.1,0.2,0.3,0.4]
plt.scatter(year,pop,s=weight)
plt.show()
#柱形图
value=[0,0.6,1.4,1.6,2.2,2.5,2.6,3.2,3.5,3.9,4.2,6]
plt.hist(value,bins=3)
plt.show()
plt.clf()#clear the current figure

在这里插入图片描述

       以上就是输出的4幅图片,不过关于柱形图,我想多说两句,他的原理其实是首先在一维坐标轴上确定每个区间有多少样本数,然后在以二维平面将样本数表示出来,如下图所示。在hist的命令中有一个bins的选项,这个选项就是将坐标轴区分成多少个区间,默认是10个,当然你可以进行设置,这里我就设置了3个区间。更多的选项可以参考help(plt.hist)。
在这里插入图片描述
       当然,作图并不是一件简单的事,你需要将图片呈现给别人,让别人看懂,那么就需要对图片进行一系列的自定义操作,比如添加轴标签,标题等,让观众能够更加清楚的了解到你想表达的想法。

plt.scatter(year,pop)
plt.xlabel('Year')#添加X轴标签
plt.ylabel('Population')#添加Y轴标签
plt.title('World Population Projections')#添加标题
plt.yticks([0,2,4,6,8,10],['0','2B','4B','6B','8B','10B'])#更改y轴坐标刻度以及标签
plt.grid
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值