- 博客(6)
- 收藏
- 关注
原创 浅谈2022梧桐杯乡村、城市赛道双TOP1——从数据分析的角度
本文以2022年梧桐杯数字城市与数字乡村赛道的双TOP1举例,带领大家完成一次有效的结构化赛题数据分析
2022-11-27 23:36:03 1343 3
原创 EDA(数据探索性分析)常用分析手段--数据挖掘稍微进阶篇
在数据挖掘比赛的开始,我们往往会对数据进行一系列探索,以了解训练集与测试集之间的差异,或是希望对数据进行更深刻的了解。这里总结了一些常用的数据分析手段如下:
2022-01-30 22:07:06 1797
原创 数据挖掘与算法竞赛Baseline构建(不定时补充)
在我们还是一个小白时,我们往往会对比赛感到无从下手,对于别人分享的Baseline往往会感觉,哇,好腻害!那么问题来了,如何写出自己的Baseline呢?
2022-01-30 22:02:10 1333
原创 常用特征总结(不定时补充)--数据挖掘稍微进阶版
特征工程可谓是对于结构化赛题来说最重要的一点了,但是你还是只会对表格进行groupby然后取统计吗?那你就真的要说拜拜啦
2022-01-30 22:00:41 1787
原创 多表格常用DataFrame操作-数据挖掘稍微进阶篇(不定时补充
数据挖掘竞赛中,表格类型数据往往以多表的形式出现,这给我们进行表格处理造成了一定困难。下文对常见多表格处理方式进行了举例。
2021-12-27 09:49:15 1062
原创 Kmeans原理实现——(python实现包含手肘法,kmeans++,降维可视化)
实验过程步骤(注意是主要关键步骤,适当文字+截图说明)、实验结果及分析一、总代码呈现#n为样本数目#m为特征数目#k为簇心数目#导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport copy as cpfrom sklearn.decomposition import PCA#计算欧几里得距离def Eucl_distance(array_x,a.
2021-08-01 19:15:29 6175 5
空空如也
dijkstra迪杰斯特算法邻接表加二叉堆实现python版
2022-10-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人