自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 imblearn 解决样本不均衡问题,上采样与下采样

类似于sklearn的先对类实例化,拿到一个转换器对象,然后调用对象的fit_resample方法,返回值即为上采样后的样本与标签,下采样过程相同。数据增强仅仅用于训练数据集,不需要改变交叉验证集和测试集。这里还对一批图像数据进行展平操作,下采样过程相同。解释,简单的对欠采样的少数样本进行随机选择添加。解释,简单的对多数样本进行随机选择删除。

2023-06-24 10:36:35 251

原创 西电数据挖掘 kmeans用于waveform数据集,并对无噪声图像分割

clusterA[:, 0].A == cent用于找到所有属于这一簇的样本,返回所有属于这一簇样本的下标。# np.random.rand用于生成k行1列的0~1之间的均分分布的随机数。# 计算第i个样本和第k个中心的距离,通过找到距离最近的那一个。# 创建矩阵,行代表聚类中心的个数,列代表样本数据集的特征维度。# 计算两个向量的距离(每个分量的差的平方求和然后开平方)即欧式距离。# 读取数据集第二个维度的长度,即样本的特征个数。# 修改存放簇标号的矩阵。# 返回k个聚类中心,和样本隶属于哪个簇。

2023-04-30 10:31:46 510 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除