数据挖掘
文章平均质量分 86
hzb_csdn
华南理工大学
展开
-
数据挖掘过程总结
根据博客知乎等资料加上自身理解整理的资料1.问题定义:分类/回归,可行性分析2.数据准备与数据预处理数据准备:确定数据挖掘任务所涉及的操作数据对象(目标数据),也就是根据数据挖掘任务的具体要求,从相关数据源中抽取与挖掘任务相关的数据集 数据清洗:清除错误异常样本(根据问题确定具体判断条件),清除重复样本缺失值:样本缺失值较少时,使用均值\众数填充,针对模型思考,对于树模型,可以把缺失值当成一原创 2016-06-30 20:11:02 · 6377 阅读 · 0 评论 -
集成学习自动权重设置python实现
import pandas as pdimport numpy as npfrom scipy.optimize import minimizefrom sklearn.cross_validation import StratifiedShuffleSplitfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.原创 2016-11-25 16:45:21 · 3241 阅读 · 0 评论