机器学习相关算法理解
决策树算法:
以ID3算法为代表
特征为干,类别为叶
以干为据,划样入叶
聚类算法:
以KMeans算法为代表
随机选聚类中心--->
计算所有样本点到每个聚类中心的距离,进行组别初步划分--->
计算组内各样本点到本组聚类中心距离均值,得出聚类中心在本组的最佳位置--->
再次计算所有样本点到各聚类中心距离,判断是否需要重新划分组别,如果需要则重新划分,再次计算聚类中心在新组内最佳位置,如果不需要,则结束算法,终极版聚类中心形成
这里的关键在于选K
我们根据肘部法选K,也就是说我们预测K的多个可能值,然后分别计算以这些值为K时的WSSSE,然后选择变化率最大的那个
WSSSE:该方法是集中平方误差和指标,它通过对计算数据集里所有的点到簇中心点的距离的平方和来衡量聚类的效果