一个被代码耽误了的灵魂女球手的数据分析进军之路(一)

其实,我是一个不善(lan)于(de)表达的人。鉴于前段时间找实习的时候屡屡碰壁,要么就是无处施展的技能,要么就是海选就被PK掉了,好在还有一颗坚强的?,经过一段时间的反思,本懒人决定要开始好好练就一些技能,并开始抵制速食时代快速输入没有输出的现象。
虽然一直没有找到数学分析相关的实习,但菜菜坚信既然选择了远方,便只顾风雨兼程吧。作为一个准备投身于数据分析的小白,在看了数据大佬们对数据分析的解析之后,总结出以下几项必备技能:1作图能力;2对SQL的掌握程度;3对机器学习算法的掌握程度(建模的能力);4对数据的敏感程度(BI方向,谁动了我的奶酪)
今天想要和大家分享的是第一条,数据可视化 相信大家对画图一点都不陌生,尤其是工科科研狗,谁的论文里还能没几个图,希望通过我的分享,能够让你论文中的图足够高逼格。
好啦,开始进入主题吧,本小白选用python完成数据可视化。
编译器:pycharm 主要涉及库:matplotlib

以上八种可视化图形貌似看上去仅仅是下表中的差距。enmmm其实仿佛可以这么理解,掌握着8种写法就是画图的开始,然后接着就是一波修饰

图形展现方式代码
饼图plt.pie()
折线图plt.plot()
直方图plt.bar()
散点图plt.scatter(x,y)
气泡图plt.scatter(x,y,s)
热力图sns.heatmap()
箱线图plt.boxplot()
小提琴图sns.violinplot()

其实图形的表达范式十分明确:导入库+设置字体显示+画图数据+格式修饰+plt.show()。为了避免假大空,还是直接上代码吧
、、、
//

# 饼状图

import matplotlib.pyplot as plt
#设置中文字体显示
plt.rcParams[‘font.sans-serif’]=[‘Microsoft YaHei’]
plt.rcParams[‘font.sans-serif’] = [‘SimHei’]
plt.rcParams[‘axes.unicode_minus’]=False

#饼图中各部分表示啥
labels = [u’xx’, u’xx’, u’xx’, u’xx’]
#饼图中各部分占比
sizes = [60, 15, 15, 10]
#饼图中各部分的颜色
colors = [‘red’, ‘yellow’, ‘blue’, ‘green’]
#突出显示谁(explode=explode较佳显示占比最大的那部分)
explode = (0.05, 0, 0, 0)

patches, l_text, p_text = plt.pie(sizes, explode=explode, labels=labels, colors=colors,
labeldistance=1.1, autopct=’%2.0f%%’, shadow=False,
startangle=90, pctdistance=0.6)
for t in l_text:
t.set_size = 30
for t in p_text:
t.set_size = 20

plt.title(’ ‘)
#设置x,y刻度轴一致,这样才能是个圆饼
plt.axis(‘equal’)
#loc表示legend的位置,就是可设置为四个角‘upper right’ ‘upper left’ ‘lower right’ 'lower left’这四种
#bbox_to_anchor表示legend与图形之间的距离,无特殊要求可忽略(左,下)
plt.legend(loc=‘upper left’, bbox_to_anchor=(-0.1, 1))
plt.grid()
plt.show()
、、、
最后的效果如下,由于小白论文中的图保密,所以各位看官看看效果即可,色彩搭配可根据个人喜好设置。好啦饼图的绘制到此告一段落了
在这里插入图片描述
折线图+散点图
一般这两个会结合使用,且使用范围十分广泛,对比趋势真的明显。
今天是6.8号,小白以今天的气温变化为数据基础,来看一下今天的日气温变化图吧。

#范式1导入库
import matplotlib.pyplot as plt
import numpy as np
#设置字体显示
plt.rcParams['font.sans-serif']=['Microsoft YaHei']
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus']=False
#设置数据
y1=np.array([25.8,26.5,27.8,29.7,30.6,30.8,31.3,30.4,30.3,29])
x=np.array(['8:00','9:00','10:00','11:00','12:00','13:00','14:00','15:00','16:00','17:00'])
#以点图表示
plt.scatter(x,y1)
#画折线
plt.plot(x,y1,linestyle='--',linewidth=2,color='purple',marker='o',markersize=6,markerfacecolor='yellow',label='2019.6.8')
plt.xlabel('时间')
plt.ylabel('温度(℃)')
plt.ylim((0,40))
plt.xticks(rotation=45)
plt.title('日温变化图(℃)')
plt.legend()
plt.show()

在这里插入图片描述
直方图
直方图是日常统计分析中比较常见的一种图,基本流程和上面两种相同。

import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.sans-serif']=['Microsoft YaHei']
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus']=False
x=np.array(['小明','小红','小绿','小蓝'])
y=np.array([100,90,90,95])
plt.barh(x,width=0.5,height=y,tick_label=x.data,color='yellow')
plt.title('期末考试成绩')
plt.ylabel('分数')
plt.style.use('ggplot')
# for y,x in enumerate(y.data):
#     plt.text(x+0.1,y,'%s' %round(x,1),va='center')
plt.show()

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值