![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
MaxeeoveCR
DL && ML
展开
-
【python】数据重采样技巧:自定义概率分布采样
碎碎念近期做数据处理的时候准备尝试下根据标签分布构建自定义采样概率来缓解data imbalance问题。举个例子,比如有一个标签类别年龄 = {幼年, 青年, 中年, 老年},某场景下标签分布为 {100, 4000, 8000, 2000},构建一种自定义采样概率 {0.528, 0.155, 0.122, 0.195},如何依据这种自定义概率分布进行多次采样呢?函数random.choices(population,weights=None,*,cum_weights=None,k=1)原创 2022-05-06 10:06:02 · 1582 阅读 · 0 评论 -
K-means实现(C++)
k-means步骤步骤1:随机设置K个中心点步骤2:每个点计算到各中心点距离,选取距离最近的中心点,进入聚类簇集步骤3:计算并得到每个聚类簇集的重心(点集的均值)步骤4:计算重心与簇集中心距离,如果距离>设定阈值,重新进入步骤2;否则跳出代码实现/* k - means */class Point{ //Point() { this->x = 0; this->y = 0; };public: Point() {}; ~Point原创 2021-10-13 11:06:27 · 416 阅读 · 0 评论