- 博客(12)
- 收藏
- 关注
原创 零基础入门数据挖掘Task05
模型融合简单加权融合对于回归任务来说,可以训练出不同的模型,然后在将每个模型预测出来的结果进行加权平均。根据各个模型的最终预测表现分配不同的权重以改变其对最终结果影响的大小。对于正确率低的模型给予更低的权重,而正确率更高的模型给予更高的权重。from sklearn import metrics# 各模型的预测结果计算MAEprint('Pred1 MAE:',metrics.mean...
2020-04-04 21:12:13
115
原创 数据挖掘入门_Task04
线性回归模型线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。可以直接使用sklearn建立线性模型:from sklearn.linear_model import LinearRegressionmodel = LinearRegression(normalize=True)model.fit(...
2020-04-01 21:27:34
179
原创 二手车交易价格预测 Task03
异常值处理箱线图分析删除异常值上图是一个power字段的箱线图,从上图可以看出,这个图形中包含了大量异常数据点,它们偏离中间的数据主体。箱线图如何判断数据是异常数据?箱线图中间是一个箱体,也就是粉红色部分,Q1是下四分位数,Q3是上四分位数,中间是中位数,上下四分位数之差是四分位距(IQR),用Q1-1.5IQR得到下边缘,Q3+1.5IQR得到上边缘。在上边缘之外的数据就是极大异常值...
2020-03-28 17:02:46
202
原创 二手车交易价格预测 Task02
数据探索性分析数据探索性分析主要可以按照以下步骤执行:1. 载入各种数据科学以及可视化库:数据科学库pandas、numpy、scipy;可视化库matplotlib、seabon;其他;2. 载入数据:载入训练集和测试集;简略观察数据(head()+shape);通过观察shape可以知道加载的数据大小与你想的是否一致,防止出错。3. 数据总览:通过describ...
2020-03-24 21:28:45
123
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人