数据挖掘
文章平均质量分 78
投笔丶从戎
PuTTY 本无树,MinGW 亦非台。
展开
-
#数据挖掘--第4章:建模调参之决策树与随机森林初体验
#机器学习--第4章:建模调参之决策树与随机森林初体验一、原理概述二、算法实现 序言:本系列博客面向初学者,只讲浅显易懂易操作的知识。一、原理概述 不知初学编程时的你是否和我一般,曾异想天开地想,游戏是不是由很多很多 if 写出来的,或者我能不能用一万行 if 来写一个程序或算法。 而决策树,在某种程度来说,就是由很多很多 if 构成的算法。 决策树其实在我们生活中随处可见,就比...原创 2020-04-12 18:49:03 · 6972 阅读 · 0 评论 -
#数据挖掘--第3章:建模调参之支持向量机SVM初体验
#机器学习--第3章:建模调参之支持向量机SVM初体验 序言:本系列博客面向初学者,只讲浅显易懂易操作的知识。 基础知识准备: 一、我们在进行训练之前,常常要对样本进行归一化、标准化或正则化,以提高训练效果,这三个概念相近但不一样,归一化是为了消除不同数据之间的量纲,方便数据比较和共同处理,比如在神经网络中,归一化可以加快训练网络的收敛性;标准化是为了方便数据的下一步处理,而进行的数据...原创 2020-04-12 18:48:13 · 7404 阅读 · 0 评论 -
#数据挖掘--第2章:特征工程
#机器学习--第2章:特征工程一、特征工程的意义二、特征工程一、特征工程的意义 特征工程是比赛中最至关重要的的一块,特别的传统的比赛,大家的模型可能都差不多,调参带来的效果增幅是非常有限的,但特征工程的好坏往往会决定了最终的排名和成绩。 特征工程的主要目的还是在于将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。比如,异常值处理是为了去除噪声,填补缺失值可以加入先验知识等...原创 2020-04-11 11:37:48 · 7332 阅读 · 0 评论 -
#数据挖掘--第1章:EDA数据探索性分析
#机器学习--第1章:EDA数据探索性分析一、序言二、EDA的意义三、EDA的流程1、载入数据并简略观察数据一、序言 本系列博客包含:数据分析、特征工程、模型训练等通用流程。将会一步一步引领大家完成一次完整的机器学习案例。点击下载 本系列博客所用数据集,提取码: r6m6。 数据相关字段解释:项目ValueSaleID交易ID,唯一编码name汽车交易名称...原创 2020-03-24 19:14:04 · 8909 阅读 · 0 评论