安富贵-CSDN博客

原创 imblearn 解决样本不均衡问题，上采样与下采样

类似于sklearn的先对类实例化，拿到一个转换器对象，然后调用对象的fit_resample方法，返回值即为上采样后的样本与标签，下采样过程相同。数据增强仅仅用于训练数据集，不需要改变交叉验证集和测试集。这里还对一批图像数据进行展平操作，下采样过程相同。解释，简单的对欠采样的少数样本进行随机选择添加。解释，简单的对多数样本进行随机选择删除。

2023-06-24 10:36:35 251

原创西电数据挖掘 kmeans用于waveform数据集，并对无噪声图像分割

clusterA[:, 0].A == cent用于找到所有属于这一簇的样本，返回所有属于这一簇样本的下标。# np.random.rand用于生成k行1列的0～1之间的均分分布的随机数。# 计算第i个样本和第k个中心的距离，通过找到距离最近的那一个。# 创建矩阵，行代表聚类中心的个数，列代表样本数据集的特征维度。# 计算两个向量的距离(每个分量的差的平方求和然后开平方）即欧式距离。# 读取数据集第二个维度的长度，即样本的特征个数。# 修改存放簇标号的矩阵。# 返回k个聚类中心，和样本隶属于哪个簇。

2023-04-30 10:31:46 510 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 imblearn 解决样本不均衡问题，上采样与下采样

原创 西电数据挖掘 kmeans用于waveform数据集，并对无噪声图像分割

空空如也

空空如也

原创西电数据挖掘 kmeans用于waveform数据集，并对无噪声图像分割