自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 浅谈2022梧桐杯乡村、城市赛道双TOP1——从数据分析的角度

本文以2022年梧桐杯数字城市与数字乡村赛道的双TOP1举例,带领大家完成一次有效的结构化赛题数据分析

2022-11-27 23:36:03 1028 3

原创 EDA(数据探索性分析)常用分析手段--数据挖掘稍微进阶篇

在数据挖掘比赛的开始,我们往往会对数据进行一系列探索,以了解训练集与测试集之间的差异,或是希望对数据进行更深刻的了解。这里总结了一些常用的数据分析手段如下:

2022-01-30 22:07:06 1767

原创 数据挖掘与算法竞赛Baseline构建(不定时补充)

在我们还是一个小白时,我们往往会对比赛感到无从下手,对于别人分享的Baseline往往会感觉,哇,好腻害!那么问题来了,如何写出自己的Baseline呢?

2022-01-30 22:02:10 1296

原创 常用特征总结(不定时补充)--数据挖掘稍微进阶版

特征工程可谓是对于结构化赛题来说最重要的一点了,但是你还是只会对表格进行groupby然后取统计吗?那你就真的要说拜拜啦

2022-01-30 22:00:41 1737

原创 多表格常用DataFrame操作-数据挖掘稍微进阶篇(不定时补充

数据挖掘竞赛中,表格类型数据往往以多表的形式出现,这给我们进行表格处理造成了一定困难。下文对常见多表格处理方式进行了举例。

2021-12-27 09:49:15 1034

原创 Kmeans原理实现——(python实现包含手肘法,kmeans++,降维可视化)

实验过程步骤(注意是主要关键步骤,适当文字+截图说明)、实验结果及分析一、总代码呈现#n为样本数目#m为特征数目#k为簇心数目#导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport copy as cpfrom sklearn.decomposition import PCA#计算欧几里得距离def Eucl_distance(array_x,a.

2021-08-01 19:15:29 6008 5

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除