数据挖掘
寸草心2130
致力于轻微改变世界
展开
-
数据挖掘建模过程
数据挖掘建模过程1.定义挖掘目标2.数据取样明确挖掘目标之后,取样本数据集标准:相关性可靠性有效性样本并非是全部数据:减少数据处理量节省系统资源使规律性更加凸显出来注意:一定要好严格控制取样质量标准资料完整无缺,各类指标齐全。数据准确无误, 反映的都是正常(而不是异常) 状态下的水平对获取的数据, 可再从中进行抽样操作。 抽样的方式是多种...原创 2019-04-16 19:57:46 · 2225 阅读 · 0 评论 -
as_matrix() 报错FutureWarning: Method .as_matrix will be removed in a future version. Use .values inst
as_matrix()报错FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead根据提示:把as_matrix()改为values即可原创 2019-04-16 20:31:02 · 5586 阅读 · 0 评论 -
Python数据挖掘过程之数据探索
数据探索根据观测、调查收集到初步的样本数据集后, 接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?是否出现从未设想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性?通过检验数据集的数据质量、绘制图表、计算某些特征量等手段, 对样本数据集的结构和规律进行分析的过程就是数据探索。数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些通常由数...原创 2019-04-18 16:03:59 · 687 阅读 · 0 评论