point 如何求elbow_python-以稳定的方式找到曲线的肘点？

最新推荐文章于 2023-06-17 18:32:47 发布

天帝君豪

最新推荐文章于 2023-06-17 18:32:47 发布

阅读量678

点赞数

文章标签： point 如何求elbow

本文链接：https://blog.csdn.net/weixin_31777631/article/details/111908417

版权

文章探讨了在Python中如何稳定地找到肘点，即数据聚类的最优数量。作者指出，肘点在不同运行中变化，提出了使用二次导数来确定肘点的代码实现。然而，这种方法对噪声敏感，最佳答案建议先对数据进行曲线拟合再找弯头，以减少噪声影响。讨论了这种方法的适用性和对误差的敏感性。

摘要由CSDN通过智能技术生成

提问

我知道这个主题存在this和this.但是,这次我想最后确定Python的实际实现.

我唯一的问题是,肘点似乎随着代码的不同实例而变化.观察这篇文章中显示的两个图.尽管它们在视觉上看起来相似,但肘点的值发生了显着变化.两条曲线均来自平均20次不同的运行.即使那样,肘点的值也有明显的变化.我可以采取什么预防措施来确保该值在一定范围内？

我的尝试如下所示：

def elbowPoint(points):

secondDerivative = collections.defaultdict(lambda:0)

for i in range(1, len(points) - 1):

secondDerivative[i] = points[i+1] + points[i-1] - 2*points[i]

max_index = secondDerivative.values().index(max(secondDerivative.values()))

elbow_point = max_index + 1

return elbow_point

points = [0.80881476685027154, 0.79457906121371058, 0.78071124401504677, 0.77110686192601441, 0.76062373158581287, 0.75174963969985187, 0.74356408965979193, 0.73577573557299236, 0.72782434749305047, 0.71952590556748364, 0.71417942487824781, 0.7076502559300516, 0.70089375208028415, 0.69393584640497064, 0.68550490458450741, 0.68494440529025913, 0.67920157634796108, 0.67280267176628761]

max_point = elbowPoint(points)

最佳答案

听起来您实际关心的是如何平滑包含噪声的数据？在这种情况下,您应该首先将曲线拟合到数据,然后找到拟合曲线的弯头？

这是否有效取决于噪声源,以及噪声是否对您的应用很重要？顺便说一句,当您从拟合中忽略点时,您可能希望通过查看数据的变化(或希望没有变化)来查看拟合对数据的敏感性(显然,有了足够高的多项式,您总会得到一个很好的拟合度)一组特定的数据,但您大概对一般情况感兴趣)

我不知道这种方法是否可以接受,虽然我认为对小错误的敏感性很差,但直觉上还是不可行的.最终,通过拟合曲线可以说,在理想情况下,基础过程是由曲线建模的,与曲线的任何偏差都是误差/噪声