![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 89
邮我超甜
这个作者很懒,什么都没留下…
展开
-
浅谈2022梧桐杯乡村、城市赛道双TOP1——从数据分析的角度
本文以2022年梧桐杯数字城市与数字乡村赛道的双TOP1举例,带领大家完成一次有效的结构化赛题数据分析原创 2022-11-27 23:36:03 · 1019 阅读 · 3 评论 -
数据挖掘与算法竞赛Baseline构建(不定时补充)
在我们还是一个小白时,我们往往会对比赛感到无从下手,对于别人分享的Baseline往往会感觉,哇,好腻害!那么问题来了,如何写出自己的Baseline呢?原创 2022-01-30 22:02:10 · 1295 阅读 · 0 评论 -
常用特征总结(不定时补充)--数据挖掘稍微进阶版
特征工程可谓是对于结构化赛题来说最重要的一点了,但是你还是只会对表格进行groupby然后取统计吗?那你就真的要说拜拜啦原创 2022-01-30 22:00:41 · 1736 阅读 · 0 评论 -
Kmeans原理实现——(python实现包含手肘法,kmeans++,降维可视化)
实验过程步骤(注意是主要关键步骤,适当文字+截图说明)、实验结果及分析一、总代码呈现#n为样本数目#m为特征数目#k为簇心数目#导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport copy as cpfrom sklearn.decomposition import PCA#计算欧几里得距离def Eucl_distance(array_x,a.原创 2021-08-01 19:15:29 · 6000 阅读 · 5 评论