点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
01.简介
本期我们将一起实现基于K-Means聚类算法的主色提取。在深入研究代码之前,让我们先了解一下K-Means算法的背景知识。
02.K均值类聚算法
K-Means算法是最流行但最简单的无监督算法。对于散布在n维空间中的所有数据点,它会将具有某些相似性的数据点归为一个群集。在随机初始化k个聚类质心之后,该算法迭代执行两个步骤:
1. 聚类分配:根据每个数据点距聚类质心的距离,为其分配一个聚类。
2. 移动质心:计算聚类所有点的平均值,并将聚类质心重定位到平均位置。
根据新的质心位置,将数据点重新分配给群集。
K-Means算法的迭代步骤
经过一定数量的迭代后,我们观察到聚类质心不会进一步移动或移动到任何新位置,聚类中的数据点也不会更改。至此,算法已经收敛。
我们将整个程序分为多个功能,首先导入该程序所需的模块
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.colors as color
import numpy as np
from collections import Counter
import pandas as pd
import math
from sklearn.cluster import KMeans
from PIL import Image
import webcolors
import json
import argparse
在启动主函数之前,我们将创建一个ArgumentParser()对象以接受命令行参数,并创建相应的变量以接受命令行参数的值。与此同时保留了两个“可选”命令行参数,即clusters和imagepath。
parser = argparse.ArgumentParser()
parser.add_argument("--clusters", help="No. of clusters")
parser.add_argument("--imagepath", help="Path to input image")
args = parser.parse_args()
IMG_PATH = args.imagepath if args.imagepath else "images/poster.jpg"
CLUSTERS = args.cluste