博客专栏  >  编程语言   >  python数据分析与数据挖掘实战学习笔记

python数据分析与数据挖掘实战学习笔记

记录学习python数据分析与数据挖掘实战之中的问题与收获

关注
6 已关注
5篇博文
  • Learning PySpark

    Chapter 1. Understanding Spark       Apache Spark是Matei Zaharia开发的一个强大的开源原始处理引擎,作为他在加州大学伯克利分校时加州大学的博...

    2017-04-11 11:30
    385
  • python数据分析工具

    一、各种库的简介1.Numpy:数组支持 http://www.numpy.org/ http://reverland.org/python/2012/08/22/numpy/ 2.Scipy:...

    2017-03-28 16:01
    279
  • python数据探索

    第三章 数据探索3.1 数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2...

    2017-04-05 15:22
    455
  • 数据预处理

    数据预处理有四个任务,数据清洗、数据集成、数据 变换和数据规约。一、数据清洗1.缺失值处理 处理缺失值分为三类:删除记录、数据补差和不处理。 数据补插方法: 1. 补插均值/中位数/众数 ...

    2017-04-06 11:37
    609
  • 挖掘建模

    一、分类与预测分类和预测是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型,预测给定自变量对应因变量的值。 1.主要分类与预测算法 回归分析 决策树 ...

    2017-04-07 15:24
    860

img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部