示例数据集如下:
x1=np.array([[1,1],[2,2],[3,3]])
x2=np.array([[1,1],[3,3],[2,2]])
x3=np.array([[1,1], [3,3.5], [2,1.5]])
plot绘制线段顺序是根据数据集中点的横坐标原始序列顺序逐点绘制出来的,观察示例数据集,x1、x2数据样本点均在一条直线上,x1、x2数据样本不同之处是x1数据样本点的横坐标原始序列是升序排列。绘制如下图所示,x1、x2数据样本顺序不同,但由于均在一条直线上,绘制线段重叠在一起,看不出来。而x3数据样本点不在一条直线上且不是顺序排列,故绘制效果如下图所示
对x3数据样本点按照横坐标作升序处理,如下
x4=np.array([[1,1],[2,1.5],[3,3.5]])
重新绘制x3、x4数据,如下所示
总结:当样本点均在一条直线上的时候,使用plot绘制线段,线条都重叠在一条直线上,看不出来,所以无需对样本点作排序处理(排序也可以,简省算力);当样本点不在一条直线上的时候,则需要对样本点作排序处理,否则会得到如下结果。这也是为什么在机器学习实战这本书的局部加权线性回归内容中需要先排序再绘制的原因。