在进行分类和聚类问题时,我们需要使用数据来测试算法的效果,此时采用生成两类不同的二维点(如下图)的方式的最直观的。
此时,我们可以很清晰的看到,蓝色的点为一类,红色的点为一类。我们可以使用这样的数据来测试我们算法的效果。
本文将阐述如何生成这样的二维点,并加上标签,最后整理成dataframe的格式。(如果时聚类问题,那么就不需要添加标签。)
python代码
import numpy as np
import pandas as pd
from pandas.core.frame import DataFrame
import matplotlib.pyplot as plt
#生成两个二维随机点,并转化为dataframe格式
#A的横纵坐标都在(9,10)之间
A = [[np.random.uniform(9,10) for i in range(100)],[np.random.uniform