简介
最近在科研中需要比较不同模型的预测性能,我们使用相对偏差,均方根误差等来比较结果。此时,可能会得到以下结果:
上图出现以下问题:
-
问题一:由于经典模型(Normal)在复杂数据中的预测效果不好,会出现预测非常差的情况,从而导致图形Y轴刻度被拉长,可视化效果不佳。
-
问题二:相似方法预测结果相同,无法清晰看出之间的差异性。
-
问题三:柱状图准确数字未知,只能通过主观方式估计最终结果。
基于以上问题,小编分别做了以下润色工作:
-
问题一二可以通过使用 ggbreak 包 进行多次 Y 轴截断。
-
添加每个柱状图的准确数值结果来解决问题三。
-
简单修改图形颜色,删除图例,使其变得更加美观。
最后得到以下图形:
接下来给出可复现的代码供大家参考,读者可以根据自己数据进行调整。
使用教程
数据产生
为了方便读者复现,小编手动产生一些样例数据:
com_cost = c(17.64,4.89,5.13,8.43,5.32)
com_cost_re = data.frame("Method" = c("Normal","TS","Linear","Power","Exp"),"Value"= round(com_cost,3))
com_cost_re$Method <- factor(com_cost_re$Method, levels = c("Normal","Power","Exp","Linear","TS"))
可视化
首先,对该数据进行可视化,并做了些细节调整。例如:修改配色、添加文本、删除图例等。
gg1 = ggplot(com_cost_re, aes(x = Method, y = Value)) +
geom_bar(stat = "identity", aes(fill = Method),alpha = 0.8) +
scale_fill_viridis(discrete = T)+ # 修改配色
geom_text(aes(label = Value), position = position_dodge(width = 0.8),
vjust = 2, size = 4,color = "white") + # 添加文本
coord_cartesian(ylim = c(4,18)) +
theme_bw() + # 设置主题
theme(panel.grid = element_blank(),legend.position = "none") + # 删除图例
labs(title = "", x = "Method", y = "Criteria")
gg1
此时,图形美观度基本完成,接下来使用 ggbreak 包进行多次 Y 轴截断。主要使用 scale_y_break()
函数。
注意:关于
scale_y_break()
的其他参数设置可参考:ggbreak官网教程,这里不做过多重复介绍。
gg2 = gg1 + scale_y_break(c(5.35, 8.34)) +
scale_y_break(c(0, 4.7)) +
scale_y_break(c(8.5, 17.5))
此时得到的结果为:
小编有话说
本文主要是小编在科研中存在的一个问题,最终通过一些简单搜索和调包解决问题。供大家参考~