![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
weixin_36719770
这个作者很懒,什么都没留下…
展开
-
数据挖掘实战入门(五)——模型融合
当我们根据数据及需求采取了不同的模型后,会因为我们对模型的选择和参数的调整不同而产生不同的效果。这时,我们可以通过模型融合,取优去劣,对结果做最后的改善。 常见的模型融合方法有:简单加权融合、stacking、blending、boosting stacking是用初始训练数据训练出若干基学习器后,用这几个学习器的训练结果作为新的训练集,来学习一个新的学习器。但stacking更容易过拟合,可以采...原创 2020-04-04 21:09:14 · 200 阅读 · 0 评论 -
数据挖掘实战(二)——建模调参
很多模型都假设数据误差项符合正态分布,所以对于不符合误差项正态分布的数据要进行处理。比如我们使用的数据,需要预测的价格存在长尾,所以要先进行处理,比如log操作,才能使模型更好的拟合。 对于不同的问题使用不同的模型,模型主要分线性和非线性。我们这次做的是简单的价格预测,是简单的线性回归。 建好模型并做好处理后选择调参方法,优化参数。常用的调参方法有:贪心法、网格调参法、贝叶斯调参法。 ...原创 2020-03-31 20:49:33 · 158 阅读 · 0 评论 -
数据挖掘实战入门(二)——特征工程
*——数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。* 特征工程算是正式开始数据挖掘的第一步,目的是尽量从原有数据中提取构造特征,以供后续算法或模型使用。特征构造的好坏,直接影响到我们最终的结果。 一、预处理 为更好的表示数据的特征,我们需要对原数据进行一些处理,包括异常值处理、缺失值处理、归一化标准化等等等等。 异常处理 对于一些明显的异常数据,比如规律分布的数据中的少数离...原创 2020-03-28 20:32:08 · 275 阅读 · 0 评论 -
数据挖掘实战入门(一)——EDA
数据挖掘实战入门(一)——EDA1 数据源2 初步探索 拿到一个数据后往往毫无头绪,即使已经清楚我们面对的问题是分类、回归,或者是其它,但对于复杂的数据还是不知道该如何下手,这个时候就需要进行探索性的分析啦。探索性数据分析(EDA)是一种分析数据集以概括其主要特征的方法,通常使用可视化方法。 总而言之言而总之,EDA的目的是探索数据的结构,处理数据中的显著异常或缺失,提高数据质量,并初步了解数据...原创 2020-03-24 20:31:36 · 745 阅读 · 0 评论