起因是LOESS平滑曲线拟合的时候出现了警告信息,大概意思是我span参数设置得太小了,导致了过拟合。
过拟合可能会出现一些十分迷惑的波动,或者一些距离较远的点拟合不到 。
比如,上面是比较理想的拟合状态,span值是0.6.
当span值设置为0.4的时候,图像就开始“抽搐”,并且出现了警报信息。
当span值设置为0.5的时候,看上去比0.4平滑一些,但是最上面那个点没拟合上,也不是理想的图。
一般,span
参数控制 LOESS 平滑曲线的平滑程度,其值通常在 0 到 1 之间。较小的 span
值会使曲线更贴近数据点,而较大的 span
值会使曲线更平滑。
那么如何找到合适的span参数?死办法可能0-1之间开盲盒,都试一试,目测个最好的,能用就行。
一些简单的方法(摘自gpt):
如何估测 span
参数的参考范围
-
数据点数量:如果数据点较少,通常需要较大的
span
值来避免过拟合;如果数据点较多,可以使用较小的span
值来捕捉数据的细节。(也就是根据数据点的数量考量,我的图数据点9个,span值0.6,那么应该算是比较少的数据点,仅供参考) -
数据的波动性:如果数据波动较大,可能需要较小的
span
值来捕捉这些波动;如果数据较平稳,可以使用较大的span
值。 -
经验法则:在没有明确指导的情况下,可以尝试从 0.5 开始,并根据结果进行调整。通常,
span
值在 0.5 到 0.8 之间是一个常见的选择范围。 -
自用笔记,仅供参考。