如何为自己的大模型做一张漂亮的数据分布图

在这里插入图片描述
上图来自BIGBIO,如果你是临摹大神,你可以纯手工画一个,但如果你不是怎么办呢?
首先,你要知道这三种图的名字
在这里插入图片描述

树图

百度首选画法为python 的 pyecharts包
newdata处理成这种格式

[{"value": 2, "name": "TT-ts", "children": [{"name": "IMCS-V2-MRG", "value": 1}, {"name": "Text2DT", "value": 1}]},
  {"value": 2, "name": "TT-ds", "children": [{"name": "meqsum", "value": 1}, {"name": "multi_xscience", "value": 1}]},
  {"value": 2, "name": "TP-te", "children": [{"name": "scitail", "value": 1}, {"name": "mediqa_rqe", "value": 1}]}]
c = (
    TreeMap()
    .add(
        series_name="aaa",
        data=newdata,
        levels=[
            opts.TreeMapLevelsOpts(
                treemap_itemstyle_opts=opts.TreeMapItemStyleOpts(
                    border_color="#555", border_width=4, gap_width=4
                )
            ),
            opts.TreeMapLevelsOpts(
                color_saturation=[0.3, 0.6],
                treemap_itemstyle_opts=opts.TreeMapItemStyleOpts(
                    border_color_saturation=0.7, gap_width=2, border_width=2
                ),
            ),
            opts.TreeMapLevelsOpts(
                color_saturation=[0.3, 0.5],
                treemap_itemstyle_opts=opts.TreeMapItemStyleOpts(
                    border_color_saturation=0.6, gap_width=1
                ),
            ),
            opts.TreeMapLevelsOpts(color_saturation=[0.3, 0.5]),
        ],
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="数据分布图"))
    .render("层级矩阵树图2.html")
)

效果如下
在这里插入图片描述

直方图/水平条

在这里插入图片描述
如果采用excel作直方图,只会导致相同颜色不能靠着一起,或者说同一图例的数据条分隔开.如图所示
在这里插入图片描述
当然wps也没有相同颜色靠着一起的功能
这时候可以采用python的matplotlib包

import pandas as pd
df = pd.read_excel('temp.xlsx') #读取xlsx中第一个sheet
test_data=[]
names = df.iloc[:,[0]].values
dataclass=df.iloc[:,[1]].values
datavalue=df.iloc[:,[2]].values
data1 = df.iloc[0].values
data={}
for idx,name in enumerate(names):
  sample={}
  data1 = df.iloc[idx].values
  sample['name']=data1[0]
  sample['value']=int(data1[2])
  if data1[1] not in data.keys():
    data[data1[1]]=[]
  data[data1[1]].append(sample)
import matplotlib.pyplot as plt

y=[]
precolors = plt.cm.tab20.colors
colors=[]
lines=[]
lable=[]
for idx,key in enumerate(data.keys()):
  lable.append(key)
  line=plt.Line2D([0], [0], color=precolors[idx], lw=4)
  lines.append(line)
  for xi in data[key]:
    colors.append(precolors[idx])
    y.append(xi['value'])
x = list(range(len(y)))

plt.figure(figsize=(20,8))
plt.legend(lines, lable,loc='best')
plt.barh(x, y, color=colors,log = True)
plt.yticks([])
# set ticks at the mean positions of the bars
plt.margins(x=0.001)  # less empty space at the left and right of the bars
plt.show()

在这里插入图片描述这里有一个小细节坐标轴设置为log形式,因为数据分布并不均衡,若是均值的坐标轴就会只能看见1到2条数据直线

填充气泡图

在这里插入图片描述
这个图很简单,嫌弃下面步骤复杂的人可以自己用画版画.
在这里插入图片描述
进入软件后点击数据,新建数据源,excel格式,选择自己的excel文件
在这里插入图片描述
如图已经导入数据
点击工作表1开始数据可视化,我这里用4做示范在这里插入图片描述因为BIGBIO气泡图以任务为计数条件,因此右键任务,选择转换为度量,此时发现可以选择气泡图,选择后将属性调整如图所示
在这里插入图片描述下面讲一下这个标记框具体操作方法
在这里插入图片描述
如图点击条目前面的标记可以切换标记类型,这五个类型分别决定颜色区分的标准,大小区分的标准,图上显示的文字,详细信息,鼠标放上去显示的信息,然后就明白我为什么这么设置了

细节

在这里插入图片描述
如果你标签显示不全,除了调小字号也可以尝试关闭自动换行在这里插入图片描述
单击这个强制显示标签
在这里插入图片描述
勾选允许覆盖
在前面的图中可以看到这个软件实际上是可以显示我们所需的全部三种图的,
因此我们在这将上面两个图实现一下,标志和行列设置如图
在这里插入图片描述
在这里插入图片描述
在仪表容器中将三幅图组合起来
在这里插入图片描述完成

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: ck表情识别数据集是一个广泛应用于计算机视觉领域的数据集,用于情感识别和表情分类任务。数据集包含了来自不同人的面部表情图像,涵盖了7种不同的情感或表情类别,即“生气”、“厌恶”、“恐惧”、“高兴”、“伤心”、“惊讶”和“中立”。 数据分布表是指按照不同类别或情感对数据进行统计和分布的一张表格。在ck表情识别数据集的数据分布表中,每一列代表一种情感类别,每一行代表一个样本。表中的元素表示对应样本是否属于对应情感类别,通常用二进制表示,1表示属于,0表示不属于。 在ck表情识别数据集的数据分布表中,可以统计每一类情感所占的比例,即每个类别下的样本数量占总样本数量的比例。通过观察数据分布表,我们可以了解到每个情感类别的数据量是否平衡,是否存在样本数量过少或过多的情况。 这样的数据分布信息对于训练和评估基于ck数据集的表情分类模型非常重要。如果某个情感类别的数据量过少,可能导致模型对该类别的分类效果不佳。因此,可以根据数据分布表的信息,对数据集进行采样或调整,使得各个情感类别的数据量相对均衡,从而提高模型的泛化能力和识别准确率。 总而言之,ck表情识别数据集的数据分布表展示了数据集中不同情感类别的样本数量和分布情况,帮助我们了解和调整数据集,从而提高表情识别模型的性能。 ### 回答2: ck 表情识别数据集是用于进行情绪识别的一个研究数据集,其中包含了来自于13位志愿者的表情图像,共计327个样本。这些样本涵盖了包括快乐、悲伤、厌恶、惊讶、愤怒和恐惧等六种不同的情绪。 数据分布表将这些样本按照情绪类别进行了分类,并统计了每个情绪类别中样本的数量。根据数据分布表,可以清晰地了解到每种情绪类别的样本数量以及相对比例。 通过对数据分布表的分析,我们可以发现一些有趣的事实。首先,快乐和悲伤是数据集中最常见的两种情绪,分别占据了样本总数的30%和23%。而相对而言,恐惧是样本数量最少的情绪,仅占据了总数的5%。这些数据反映出了这些情绪在日常生活中的普遍程度。 其次,我们可以进一步观察各种情绪类别的变化趋势。例如,愤怒和厌恶在数据集中的数量相对较少,这可能与这两种情绪往往相对较为稀少有关。而惊讶在数据集中的数量较为均衡,说明这种情绪在样本中普遍存在。 最后,在进行模型训练和测试时,我们可以根据数据分布表的信息来调整样本的处理方式。例如,如果我们希望模型更好地识别恐惧情绪,可以通过数据增强技术增加恐惧情绪的样本数目,以增加模型在这一类别的训练效果。 综上所述,ck 表情识别数据集的数据分布表提供了样本分布情况的详细信息,它对于研究人员们进行情绪识别研究以及模型优化都具有重要指导意义。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值