- 博客(2)
- 收藏
- 关注
原创 imblearn 解决样本不均衡问题,上采样与下采样
类似于sklearn的先对类实例化,拿到一个转换器对象,然后调用对象的fit_resample方法,返回值即为上采样后的样本与标签,下采样过程相同。数据增强仅仅用于训练数据集,不需要改变交叉验证集和测试集。这里还对一批图像数据进行展平操作,下采样过程相同。解释,简单的对欠采样的少数样本进行随机选择添加。解释,简单的对多数样本进行随机选择删除。
2023-06-24 10:36:35 251
原创 西电数据挖掘 kmeans用于waveform数据集,并对无噪声图像分割
clusterA[:, 0].A == cent用于找到所有属于这一簇的样本,返回所有属于这一簇样本的下标。# np.random.rand用于生成k行1列的0~1之间的均分分布的随机数。# 计算第i个样本和第k个中心的距离,通过找到距离最近的那一个。# 创建矩阵,行代表聚类中心的个数,列代表样本数据集的特征维度。# 计算两个向量的距离(每个分量的差的平方求和然后开平方)即欧式距离。# 读取数据集第二个维度的长度,即样本的特征个数。# 修改存放簇标号的矩阵。# 返回k个聚类中心,和样本隶属于哪个簇。
2023-04-30 10:31:46 510 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人