暑期项目实训个人记录-2

1.数据处理入门

numpy函数学习

  1. 创建数组
  2. 数组维度
  3. 数组元素筛选
  4. 数组统计
  5. 数组排序
  6. 数组元素增删
  7. 数组组合与拼接

基本统计量

  1. 自定义数组的百分位数计算
  2. 中位数和四分位数计算
  3. 数组偏差的概念及计算
  4. 方差的概念及计算
  5. 标准差的概念及计算
  6. 协方差的概念及计算
  7. 使用矩阵来计算协方差矩阵
  8. 相关性计算

生成随机变量

  1. 均匀分布产生随机数:rand,random,randint
  2. 标准正态分布随机数:randn

pandas文件读取

  1. 使用pandas读取csv文件
  2. 读取普通文本文件
  3. 给纯数据附加标题
  4. 读取具有异常,缺失数据文件

2.数据初探

概念与机理

  1. 基本统计量
  2. 数据分布
  3. 相关性分析

流程与方法

  1. 探查数据的一般流程
  2. 数据可视化的常用方法

技术与实现

  1. 数值统计
  2. 可视化绘图

演练:获取数据分布特点及可视化展现

3.数据预处理

检测与处理缺失值与重复值

拆分数据集

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值