1.数据处理入门
numpy函数学习
- 创建数组
- 数组维度
- 数组元素筛选
- 数组统计
- 数组排序
- 数组元素增删
- 数组组合与拼接
基本统计量
- 自定义数组的百分位数计算
- 中位数和四分位数计算
- 数组偏差的概念及计算
- 方差的概念及计算
- 标准差的概念及计算
- 协方差的概念及计算
- 使用矩阵来计算协方差矩阵
- 相关性计算
生成随机变量
- 均匀分布产生随机数:rand,random,randint
- 标准正态分布随机数:randn
pandas文件读取
- 使用pandas读取csv文件
- 读取普通文本文件
- 给纯数据附加标题
- 读取具有异常,缺失数据文件
2.数据初探
概念与机理
- 基本统计量
- 数据分布
- 相关性分析
流程与方法
- 探查数据的一般流程
- 数据可视化的常用方法
技术与实现
- 数值统计
- 可视化绘图