解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题【woodwhales.cn】

本文详细介绍了如何在yolov8训练过程中处理中文数据集时matplotlib出现的乱码问题,包括找到并设置matplotlib字体文件,清理缓存,以及确保中文字体生效的方法。
摘要由CSDN通过智能技术生成

为了更好的阅读体验,建议移步至笔者的博客阅读:解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题

在 yolov8 训练自己的数据集时,如果 class 字典使用了中文,则在训练过程中会出现形如下面的警告:

C:\Users\woodwhales\AppData\Roaming\Python\Python311\site-packages\ultralytics\utils\metrics.py:427: UserWarning: Glyph 26222 (\N{CJK UNIFIED IDEOGRAPH-666E}) missing from current font.
  fig.savefig(plot_fname, dpi=250)

步骤1:找到 matplotlib 的字体文件目录

执行下述 python 脚本:

import matplotlib
print(matplotlib.matplotlib_fname())

执行上述脚本后,可以看到 matplotlibrc 文件的所在目录:

C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data\matplotlibrc

步骤2:将中文字体保存到 matplotlib

在步骤1 的基础上,可以得到 matplotlib 的文件根目录是:C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data,那么字体文件目录就在 C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data**\fonts\ttf**

在 ttf 文件目录中拷贝中文字体,格式要求为 ttf,笔者使用的是微软雅黑,可以在这里下载:Microsoft YaHei.zip

windows系统中都有微软雅黑,文件目录为:C:\Windows\Fonts,但是其格式为 ttc,可以使用这个网站在线转换为 ttf:https://transfonter.org/ttc-unpack

步骤3:清除 matplotlib 缓存

执行下述 python 脚本:

import shutil
import matplotlib

shutil.rmtree(matplotlib.get_cachedir())

步骤4:检查中文字体是否生效

执行下述 python 脚本:

import matplotlib.font_manager

print([f for f in matplotlib.font_manager.fontManager.ttflist if 'Microsoft YaHei' in f.name])

可以得到对应字体信息:

[FontEntry(fname='C:\\programs\\anaconda3\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\Microsoft YaHei.ttf', name='Microsoft YaHei', style='normal', variant='normal', weight=400, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyhbd.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=700, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyh.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=400, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyhl.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=290, stretch='normal', size='scalable')]

步骤5:matplotlib 使用中文字体

在训练集脚本的最开始,增加如下代码:

import matplotlib

matplotlib.rcParams['font.family'] = ['Microsoft YaHei']
这是因为默认字体中没有包含某些需要使用的中文字符,导致绘图出现了问题。我们可以在绘图之前设置字体,以解决这个问题。 可以使用如下代码设置字体: ```python from matplotlib.font_manager import FontProperties # 设置中文字体 font = FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf", size=14) ``` 其中,`fname`是字体文件所在的路径,这里使用的是SimHei字体,您可以根据自己的需要修改。 然后在绘图,将需要使用中文的地方,比如x轴标签、y轴标签、标题等,都加上`fontproperties=font`的参数,指定使用刚刚设置的字体。 代码如下: ```python import pandas as pd import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties # 创建DataFrame对象 data = {'证券代码': ['000609', '000993', '002615', '000795', '002766', '000971', '000633', '300173', '300279', '000831'], '证券简称': ['中迪投资', '闽东电力', '哈尔斯', '英洛华', '索菱股份', '高升控投', '合金投资', '智慧松德', '和晶科技', '五矿稀土'], '最新价': [4.8, 4.8, 5.02, 3.93, 6.78, 3.72, 4.6, 4.6, 5.81, 9.87], '涨跌幅%': [10.09, 10.09, 10.09, 10.08, 10.06, 10.06, 10.06, 10.5, 10.05, 10.04]} df = pd.DataFrame(data) # 设置中文字体 font = FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf", size=14) # 绘制条形图 plt.bar(df['证券简称'], df['最新价']) plt.xticks(rotation=90, fontproperties=font) # x轴标签旋转90度,防止重叠 plt.xlabel('证券简称', fontproperties=font) plt.ylabel('最新价', fontproperties=font) plt.title('股票数据', fontproperties=font) plt.show() ``` 这样就可以成功绘制中文字符了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值