数据挖掘竞赛
文章平均质量分 93
数据分析、数据挖掘
—Xi—
机器学习/数据挖掘/爬虫/推荐系统
展开
-
【机器学习】模型融合
模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):多树的提升方法。转载 2023-03-23 14:56:48 · 1699 阅读 · 1 评论 -
【数据挖掘竞赛】零基础入门数据挖掘-二手汽车价格预测
数据预处理时首先可以对偏度比较大的数据用log1p函数进行转化,使其更加服从高斯分布,此步处理可能会使我们后续的分类结果得到一个好的结果.notRepairedDamage 中存在空缺值,但空缺值用“-”表示,所以数据查看发现不了空缺值,将“-”替换成NaN。图中可以看出,seller,offerType,creatDate这几个特征值分布不均匀,分别查看。可以看出,seller,offerType这两个特征的取值无变化,几乎倒向同一个值,可以删除。一般来说汽车价格与使用时间成反比。原创 2022-11-01 16:01:55 · 9389 阅读 · 4 评论 -
【机器学习kaggle赛事】泰坦尼克号生存预测
回顾这个项目的基本流程:1、查看数据集,合并训练集测试集以一起进行数据清洗2、数据清洗:查看数据集空缺值,并填充空缺值3、探索性可视化:通过透视表和图表,探究各个特征与label(需要预测的值)的相关性,若有相关性则保留。4、特征选择:通过相关系数来选择。原创 2022-09-22 13:57:24 · 5858 阅读 · 1 评论 -
【数据分析】数据分析达人赛3:汽车产品聚类分析
本次教学赛是数据科学家陈博士发起的数据分析系列赛事第3场 —— 汽车产品聚类分析赛题以竞品分析为背景,通过数据的聚类,为汽车提供聚类分类。对于指定的车型,可以通过聚类分析找到其竞品车型。通过这道赛题,鼓励学习者利用车型数据,进行车型画像的分析,为产品的定位,竞品分析提供数据决策。原创 2022-10-31 20:02:30 · 5536 阅读 · 6 评论 -
【数据分析】数据分析达人赛2:产品关联分析
'软式棒球', '三角网架', '垒球', '棒球服', '头盔', '棒球手套', '球棒与球棒袋', '帽子', '硬式棒球', '击打手套', '皮带', '垒垫', '三角网架,软式棒球', '垒球,头盔', '头盔,棒球手套', '头盔,球棒与球棒袋', '头盔,硬式棒球', '头盔,软式棒球', '棒球手套,硬式棒球', '棒球手套,软式棒球', '球棒与球棒袋,硬式棒球', '球棒与球棒袋,软式棒球']2015-07-20 [球棒与球棒袋, 软式棒球, 三角网架, 帽子, 棒球服]原创 2022-10-18 21:36:10 · 2008 阅读 · 2 评论 -
【数据分析】数据分析达人赛1:用户情感可视化分析
通过这道赛题来引导常用的数据可视化图表,以及数据分析方法,对感兴趣的内容进行探索性数据分析。1 这只HD650在1k的失真左声道是右声道的6倍左右,也超出官方规格参数范围(0.05%),看...5 我觉得任何人都可以明确分别高端耳机之间的区别,不用出声都可以,毕竟佩戴感不一样,这还没法做到盲听。17173 自己焊接一下就行了,话说我820原线全新,800s原线99新,放盒子里没动了。原创 2022-10-18 20:17:02 · 3693 阅读 · 2 评论
分享