本次要更新的内容是如何使用Python绘制条形图。(本次所使用的软件是Python 3.11,没有安装的朋友们也不用担心,接下来跟着我一起操作~)
由于涉及到新软件的使用,因此本文将一并更新如何下载并使用Python相关内容。同时本文中也会涉及到在安装并使用Pyhon中可能会遇到的一些报错及其解决方法,快快码住~
内容速览:
Part 1:安装Python
Part 2:配置环境变量
Part 3:安装Sublime Text
Part 4:绘制Barplot
(有Python使用基础的小伙伴们就可以略过前三部分,直接跳到第四部分~)
Part.1/ 安装Python
Python是一款和R一样的开源的软件,可以在官网免费下载,下载网址:Welcome to Python.org
进去之后,咱们就可以看到如下界面:

点击Downloads→Windows
(由于本人使用的是Windows系统,所以这里就只介绍Windows系统的操作)

然后点击“Download Windows Installer(64-bit)” (具体选择64bit还是32bit需要看自己电脑配置),点击完之后,就可以看到Python已经开始下载了。

下载完成之后,点击已经下载好的程序:

进入安装过程:
点击完上面已经下载好的程序包之后,就会出现下面这个界面:

一定要记得勾选“Add python.exe to PATH”这一步其实就是在配置环境变量,如果忘记勾选也没有关系,还有解决办法。
勾选完之后,点击“Customize installation”,然后会出现以下这个界面,默认选项都勾选:

以上这些都勾选上,然后点击“Next",接着会出现以下这个界面,勾选“Install Python 3.12 for all users”,可以在下面“Customize install location”这里更改安装路径,放到C盘或者D盘都行,这里一定一定要记住自己的安装路径,之后还会用到!!!
然后点击“Install”就开始安装了

检查是否安装成功,同时按下Win和R,然后输入 cmd :
Win+R → cmd → Enter

接下来会出现以下这个界面:
(由于出现了个人信息,所以打码了^_^)

输入“python”

出现以上这条信息,就说明安装成功了
检查pip是否安装成功:

出现以上这条信息,就说明安装成功了
(安装成功的小伙伴就可以跳过Part 2,直接进入Part 3咯!)
报错1及解决方法:
如果没有出现以上这条信息,或者出现“Python既不是可用的内部命令,也不是可用的外部命令”,或者甚至输入“python”之后还弹窗到应用商店,那么就说明安装失败,解决方法如下:
方法①:把刚刚安装的程序全部卸载干净(这个方法不推荐,因为大家不一定能找到刚刚安装的地址都在哪)
方法②:配置环境变量
Part.2/ 配置环境变量
配置环境变量也超简单咯:
点击“此电脑” → 右键 → “属性”

点击完“属性”之后,会出现以下这个界面,然后依次点击:“高级系统设置”

点击“环境变量”

然后找到“PATH”:点击“PATH” → 点击“编辑”

然后 点击“新建” → ,然后把刚刚安装Python的路径复制到这个地方来,→ 点击“确定”,环境变量就配置好啦,然后再按照Part 1中的方法检查一下是否真的安装成功了

Part.3/ 安装Sublime Text
Sublime Text 是一款免费的、简单的文本编辑器,对初学者非常友好,可以在任何现代操作系统中安装,且几乎能直接在Sublime Text 中执行所有程序。
Sublime Text安装就更简单了,进入官网:Sublime Text - Text Editing, Done Right,然后单击Download 链接,并查找Windows 安装程序。下载安装程序后运行它,并接受所有的默认设置。

That's ok!
(当然,如果不想安装Sublime Text,直接使用IDLE(Python 自带的文本编辑器)也可以)。

Part.4/ 绘制Barplot
简介
在Python中,安装“库”需要到终端,也就是“Win+R → cmd”,在本次绘图中,我们一共需要用到以下这几个库“pandas”、“matplotlib”、“seaborn”、“numpy”
pandas:一种开源的、易于使用的数据结构和Python编程语言的数据分析工具。
matplotlib:matPlotlib是三方库,不是Python自带的库,需要额外安装,安装这个库的同时,它还会自动安装依赖的numpy库等。
seaborn:它是Python中的可视化库,可以利用它画出各种好看的统计图形。
numpy:是Python中科学计算的基础包,有包括数学、逻辑、基本线性代数,基本统计运算和随机模拟等等。
安装库:
Win + R → cmd;然后依次输入以下四行代码:
pip install pandas
pip install matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install seaborn
pip install numpy
像这样,输入完之后“Enter”:

然后每安装一个库,就会出现:

此时就说明已经成功安装了!
顺便提一句,怎么卸载不需要的库呢,输入以下代码即可:
pip uninstall pandas
接下来进入超详细的绘图过程:
(接下来的过程全部是在Sublime Text中进行的,大家记得切回Sublime Text,终端也可以运行,就是界面不太好看)
加载本次绘图所需要的库:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
解决部分正负号和中文字体不显示的问题:
# 显示正负号与中文
plt.rcParams['axes.unicode_minus'] = False
sns.set_style('darkgrid', {'font.sans-serif':['SimHei', 'Arial']})
# 去除部分warning
import warnings
warnings.filterwarnings('ignore')
创建数据集:
#构造数据
x=pd.DataFrame({"Area":["A","A","B","B","C","C"]})
y=pd.DataFrame({"Sex":["男性","女性","男性","女性","男性","女性"]})
z=pd.DataFrame({"Height":[158,152,188,165,172,160]})
data=pd.concat([x,y,z],axis=1)
print(data)
数据展示:

简单条形图绘制:
#简单条形图绘制
sns.barplot(x="Area",y="Height",data=data)
plt.show()
报错2及解决方法:
在这里,Python有可能会报错:“module 'numpy' has no attribute 'float'.”,这是因为我们下载的numpy库默认是最新的版本,而np.float从1.24起就被删除了,所以这个时候需要将我们的Numpy版本降级到1.23.5。
(未报错的话请忽略这一部分)
解决方法如下:
在终端卸载我们已经下载的numpy

并安装版本为1.23.5的numpy库

图形展示:

优化条形图细节:
①更改条形图颜色:
#修改条形图颜色
palet = sns.color_palette("hls",3)
sns.barplot(x="Area",y="Height",data=data,palette=palet)
plt.show()
palet = sns.color_palette("Paired",3)
sns.barplot(x="Area",y="Height",data=data,palette=palet,errcolor="none")
plt.show()
图形展示:


②添加误差线:
#通过指定参数errcolor,设置误差线颜色
sns.barplot(x="Area",y="Height",data=data,palette=palet,
errcolor="black", #设置误差线颜色
errwidth=1.2, #设置误差线宽度
capsize=0.05 #给误差线两端加上端点
)
plt.show()
# errcolor="none" 去除误差线

③为条形图添加一个分组标准:
#通过指定参数 hue 为条形图增加一个分组标准
sns.barplot(x="Area",y="Height",data=data,palette=palet,
hue='Sex' #通过指定参数 hue 为条形图增加一个分组标准
)
plt.show()
图形展示:

今天的更新内容就这么多咯!另外,上次关于R语言绘制箱线图和小提琴图的剩余内容也在我的另一个垃圾箱已经更新(R语言绘制箱线图及小提琴图(Part 2),公众号:统计小菜椒)。下次有时间接着给大家介绍其他优化条形图的方法以及其他图形的绘制。
欢迎大家莅临我的另一个垃圾箱!(公众号:统计小菜椒)
109

被折叠的 条评论
为什么被折叠?



