当您在集群上循环并在不指定任何颜色的情况下绘制scatter时,将使用活动属性循环器(color cycle)的默认颜色。活动属性循环器在rcParams中定义。它是通过使用的样式设置的;在您的例子中,使用'fivethirtyeight'print(plt.rcParams["axes.prop_cycle"])
> cycler('color', ['#008fd5', '#fc4f30', '#e5ae38', '#6d904f', '#8b8b8b', '#810f7c'])
此图的前两种颜色(“#008fd5”、“#fc4f30”)是您在绘图中看到的颜色。在
当您使用带有clusters作为颜色参数的scatter时,这些值将通过colormap映射到颜色。如果没有指定colormap,它将采用rcParam中定义的默认colormap。在
^{pr2}$
'fivethirtyeight'样式没有定义任何特殊的colormap,因此默认值将保持不变。(事实上,您在图片中观察到与viridis不同的颜色图,这是因为还有一些其他代码仍然处于活动状态,而这些代码在问题中没有显示。)
在这一点上,我需要开始解释;我认为你的问题实际上是如何得到一个散点,使用一个颜色贴图,它的颜色与其中的颜色循环相同。所有预定义的颜色贴图中都没有五个八分之一的循环颜色。因此,您可以通过taking the colors from the cycle手动定义颜色映射import matplotlib.colors as mcolors
cmap = mcolors.ListedColormap(plt.rcParams['axes.prop_cycle'].by_key()['color'])
现在您需要一种方法来索引colormap,因为您有离散的簇。在n = len(clusters.unique())
norm = mcolors.BoundaryNorm(np.arange(n+1)-0.5, n)
当然,这要求colormap中颜色的数量大于或等于类的数量——这里就是这种情况。在
再加上一个说明性的分类import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import matplotlib.colors as mcolors
plt.style.use('fivethirtyeight') #relevant here!!
X=pd.Series([1, 2, 3, 4, 5, 11, 12, 13, 14, 15])
Y=pd.Series([1,1,1,1,1,2,2,2,2,2])
clusters=pd.Series([0,0,0,0,0,1,1,1,1,2])
cmap = mcolors.ListedColormap(plt.rcParams['axes.prop_cycle'].by_key()['color'])
n = len(clusters.unique())
norm = mcolors.BoundaryNorm(np.arange(n+1)-0.5, n)
plt.figure(figsize = (6, 4))
sc = plt.scatter(X,Y, c=clusters, cmap=cmap, norm=norm)
plt.colorbar(sc, ticks=clusters.unique())
plt.title("example4")
plt.show()