数据挖掘
小于狙击手
这个作者很懒,什么都没留下…
展开
-
数据预处理总结
数据挖掘概念与技术定义挖掘目标–>数据取样–>数据探索–>数据预处理–>挖掘建模–>模型评价 第一章、数据挖掘的数据类型:时间序列,序列,数据流,时间空间数据,多媒体数据,文本数据,图,社会网络和web数据; 挖掘:知识类型、使用的技术、目标应用的技术、挖掘任务分类。 衡量取样数据质量的标准:1. 资料完整无缺,各类指标项齐全 2. 数据准确无误,反应的都是正常状态下的水平 数据抽样操作1. 随原创 2017-11-12 15:24:50 · 29422 阅读 · 3 评论 -
数据可视化总结
数据可视化工具整理(一)、Python数据挖掘相关扩展库Numpy 提供数组支持,以及相应的高效的处理函数Scipy 提供矩阵支持,以及矩阵相关的数值计算模块Matplotlib 数据可视化工具,作图库Pandas 强大、灵活的数据分析和探索工具StatsModels 设计建模,统计模型估计,描述统计等Scikit-Learn 支持回归、分类、聚类等的原创 2017-11-12 15:30:09 · 7271 阅读 · 0 评论 -
实战一、电力窃漏用户自动识别
实战一、电力窃漏用户自动识别取自《Python数据分析与挖掘实战》一书 学会绘制混淆矩阵图、ROC图、使用LM神经网络预测,决策树预测,拉格朗日插值法,下降趋势指标。一、数据抽取主要有用电负荷数据、终端报警数据、违约窃电处罚信息以及用户档案资料等。二、数据探索分析1、数据的分布分析查看用电类别切漏电情况,明确哪一些人群、领域窃漏电情况严重。2、周期性分析正常用电量周期性用量平稳,没有太大波动;窃漏原创 2017-11-14 13:09:04 · 1882 阅读 · 0 评论 -
朴素贝叶斯分类
朴素贝叶斯分类原理数据挖掘课后总结一下朴素贝叶斯原理,时间久了差点儿忘,再次整理一下。 首先看要求: 已由上述数据,现给如下数据和要求 1. Class: C1:buys_computer = ‘yes’ C2:buys_computer = ‘no’ 2. Data to be classified: X = (age <=30, Income = medium,Student原创 2017-11-14 20:11:05 · 2301 阅读 · 0 评论 -
混淆矩阵以及ROC图像
一、混淆矩阵总结一下混淆矩阵,分类描述及其绘制;ROC曲线含义,及其绘制1、矩阵图示如下图就是CM混淆矩阵Confusion Matrix 左边栏是数据的真实的类别,右栏是预测出的类别。简介一下TP,TN,FP,FN含义。 TP 就是 Ture Positive :原来是+,判别为 + 简记为—->“判对为正” FP 就是 False Positive :原来是 -,判别为原创 2017-11-14 21:48:15 · 3063 阅读 · 0 评论 -
python数据分析与挖掘项目实战记录
python数据挖掘项目实战记录取自《Python数据分析与挖掘实战》一书,整理各个项目中用到的数据处理方法:数据预处理方法建立模型方法绘制图形对于分类问题:用模型分类;混淆矩阵及其绘图;观测其ROC曲线; 对于聚类问题:划分类目数;获取划分类目中心;平行坐标系描述 (一)数据预处理的方法在获取数据之后,会发现一些数据值错误 一、填补空值 二、观察数据分布 三、数据清洗,使数据值都合原创 2017-11-26 17:20:24 · 13818 阅读 · 2 评论