point 如何求elbow_python-以稳定的方式找到曲线的肘点?

文章探讨了在Python中如何稳定地找到肘点,即数据聚类的最优数量。作者指出,肘点在不同运行中变化,提出了使用二次导数来确定肘点的代码实现。然而,这种方法对噪声敏感,最佳答案建议先对数据进行曲线拟合再找弯头,以减少噪声影响。讨论了这种方法的适用性和对误差的敏感性。
摘要由CSDN通过智能技术生成

提问

我知道这个主题存在this和this.但是,这次我想最后确定Python的实际实现.

我唯一的问题是,肘点似乎随着代码的不同实例而变化.观察这篇文章中显示的两个图.尽管它们在视觉上看起来相似,但肘点的值发生了显着变化.两条曲线均来自平均20次不同的运行.即使那样,肘点的值也有明显的变化.我可以采取什么预防措施来确保该值在一定范围内?

我的尝试如下所示:

def elbowPoint(points):

secondDerivative = collections.defaultdict(lambda:0)

for i in range(1, len(points) - 1):

secondDerivative[i] = points[i+1] + points[i-1] - 2*points[i]

max_index = secondDerivative.values().index(max(secondDerivative.values()))

elbow_point = max_index + 1

return elbow_point

points = [0.80881476685027154, 0.79457906121371058, 0.78071124401504677, 0.77110686192601441, 0.76062373158581287, 0.75174963969985187, 0.74356408965979193, 0.73577573557299236, 0.72782434749305047, 0.71952590556748364, 0.71417942487824781, 0.7076502559300516, 0.70089375208028415, 0.69393584640497064, 0.68550490458450741, 0.68494440529025913, 0.67920157634796108, 0.67280267176628761]

max_point = elbowPoint(points)

最佳答案

听起来您实际关心的是如何平滑包含噪声的数据?在这种情况下,您应该首先将曲线拟合到数据,然后找到拟合曲线的弯头?

这是否有效取决于噪声源,以及噪声是否对您的应用很重要?顺便说一句,当您从拟合中忽略点时,您可能希望通过查看数据的变化(或希望没有变化)来查看拟合对数据的敏感性(显然,有了足够高的多项式,您总会得到一个很好的拟合度)一组特定的数据,但您大概对一般情况感兴趣)

我不知道这种方法是否可以接受,虽然我认为对小错误的敏感性很差,但直觉上还是不可行的.最终,通过拟合曲线可以说,在理想情况下,基础过程是由曲线建模的,与曲线的任何偏差都是误差/噪声

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值