在可视化方面,Python和Power BI有什么不同,哪个更实用?

对比来说,Python在数据可视化上的能力“更胜一筹”,以Python绘制热力图为例,热力图通过颜色的变化来展示数据的分布情况,以颜色的深浅程度来表示数据值的大小,通常颜色越深表示数据值越大或者数据越密集。

热力图的应用非常广泛,它可以用于显示各种类型的数据分布,通过热力图可直观地看出数据的整体分布情况,以及不同变量之间的差异性,本案例使用双色球数据用热力图展示,用于研究每个中奖号码的分布情况。

如下选取了近30期的开奖号码数据,数据呈现不规则,需要使用Python进行数据处理,将其处理为标准数据

首先,使用pandas函数导入开奖数据,由于原始数据有合并单元格,但是导入的时候默认会取消单元格,可以向下填充将数据补齐,并且,使用groupby函数按照’期号’和’开奖日期’将中奖号码分组聚合为list列表的形式,如下为数据处理后的结果。

import pandas as pd

#数据导入
df=pd.read_excel(r'D:\系统桌面(勿删)\Desktop\双色球中奖号码.xlsx',usecols=['期号','开奖日期','开奖号码'],dtype={'期号': str,'开奖号码': str})
#数据筛选
df=df.iloc[1:]

#向下填充
df_ffilled = df.fillna(method='ffill')
#中奖号码分组聚合
result = df_ffilled.groupby(['期号','开奖日期']).apply(lambda x: x['开奖号码'].to_list()).reset_index() 
result.rename(columns={0:'中奖号码'},inplace=True)#重命名

result.head()#数据预览

中奖号码数据为列表的形式,将其转化为字符型,然后使用replace函数替换多余的符号,并且,使用split函数将中奖号码分列,如下为每一期中奖号码按照色球位置分列后的结果。

#中奖号码分列
result['中奖号码'] = result['中奖号码'].astype(str)
result['中奖号码']=result['中奖号码'].str.replace("[","")
result['中奖号码']=result['中奖号码'].str.replace("]","")
result['中奖号码']=result['中奖号码'].str.replace("'","")
df_split=result['中奖号码'].str.split(',',expand=True)

df_split.head()

数据分列后,统计每一期中奖号码出现的次数,如下为号码出现的次数,由结果可以得知,以第一个红球位置号码出现次数为例,数字1出现了7次,数字10出现了3次,数据11出现了1次…,依此统计每个号码在该色球位置出现的次数。

#对每一位的中奖号码统计出现次数
df1=df_split.groupby(0).size()
df2=df_split.groupby(1).size()
df3=df_split.groupby(2).size()
df4=df_split.groupby(3).size()
df5=df_split.groupby(4).size()
df6=df_split.groupby(5).size()
df7=df_split.groupby(6).size()

print(df1,df2,df3,df4,df5,df6,df7)

将统计的次数横向合并,由于有些数字没有出现,将显示为NaN,为了便于后面可视化展示,可以将其替换为0,如下即为表格合并后的结果,其中,横向0到6代表着红球和蓝球的位置,竖向10到14代表着中奖号码,表格中的数字为中奖号码出现的次数。

#横向表合并(行对齐)
data=pd.concat([df1,df2,df3,df4,df5,df6,df7],axis=1,sort=True)
data=data.fillna(0)#空值NaN替换为0
data=data.round(0).astype(int) #浮点数转换为整数

data.head()

导入seaborn库,使用sns.heatmap函数绘制热力图,由热力图可以直观地显示每一个中奖号码在每一个色球位置出现的频次,频次越大则出现该数字的概率越大。

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()#使用默认设置
plt.figure(figsize=(6,9))#设置图片大小
plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文

plt.title('双色球中奖数字热力图')

#绘制热力图,annot显示数值 vmin,vmax用于设置颜色映射的数值范围 cmap颜色映射
sns.heatmap(data,annot=True,vmin=0,vmax=5,cmap="Blues") 
#坐标轴设置
plt.xlabel('双色球位数')
plt.ylabel('双色球数字')
x=['红球1','红球2','红球3','红球4','红球5','红球6','蓝球1']
plt.xticks(range(0,7,1),x,ha='left')

plt.show()

可视化结果如下,统计每个中奖号码出现频率越高的号码都有哪些?如下为每个色球位置中奖号码的频次。

  • 红球1:1出现7次,2出现7次
  • 红球2:8出现5次
  • 红球3:13出现4次
  • 红球4:25出现4次
  • 红球5:25出现4次,29出现4次,30出现4次
  • 红球6:33出现5次
  • 蓝球1:4出现5次

基于此可以出现一些组合号码,比如01 08 13 25 25 33 04,由于每次的组合号码的数字都是独立事件,上面的数字组合具有随机性。

以上,我们使用Python绘制一个双色球热力图,使用热力图呈现每个中奖号码的出现频次,频率越高,则在热力图上显示的颜色越深,借助案例演示Python数据可视化在实际生活中的应用,如果你在学习中遇到问题,可随时向我提问,解决你的问题~

Python 的迅速崛起对整个行业来说都是极其有利的 ,但“人红是非多”,导致它平添了许许多多的批评,不过依旧挡不住它火爆的发展势头。

如果你对Python感兴趣,想要学习python,这里给大家分享一份Python全套学习资料,都是我自己学习时整理的,希望可以帮到你,一起加油!

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓
Python全套学习资料

在这里插入图片描述

1️⃣零基础入门

① 学习路线

对于从来没有接触过Python的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

② 路线对应学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~
在这里插入图片描述

③练习题

每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
在这里插入图片描述

2️⃣国内外Python书籍、文档

① 文档和书籍资料

在这里插入图片描述

3️⃣Python工具包+项目源码合集

①Python工具包

学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!
在这里插入图片描述

②Python实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!
在这里插入图片描述

③Python小游戏源码

如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!
在这里插入图片描述

4️⃣Python面试题

我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述

5️⃣Python兼职渠道

而且学会Python以后,还可以在各大兼职平台接单赚钱,各种兼职渠道+兼职注意事项+如何和客户沟通,我都整理成文档了。
在这里插入图片描述

上述所有资料 ⚡️ ,朋友们如果有需要的,可以扫描下方👇👇👇二维码免费领取🆓
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值