自然间断点是进行数据分类最常用的方法之一。
使用Jenkspy库计算自然间断点
1、pypi安装jenkspy
pip install jenkspy
2、调用jenkspy
import jenkspy
import random
list_of_values = [random.random()*5000 for _ in range(12000)]
breaks = jenkspy.jenks_breaks(list_of_values, nb_class=6)
print breaks
在数据量较大的情况下,速度很---慢
7.5w条数据统计5个间断点耗时30s左右