数据分析

数据分析基本概念

  • 明确思路→数据收集《分布式爬虫实战》→数据处理→数据分析→数据展现
  • 常用的收集途径: 公开信息,外部数据库,自有数据库,调查问卷,客户数据
  • 数据清洗: 可读性,完整性,唯一性,权威性及合法性
  • 常见的数据类型
    1,类别型数据 (1)取值种类 (2)每类取值的分布
    2,数值型变量 (1)极值和分位点 (2)均值和标准差 (3)变量间相关性
    3,通用数据描述 (1)缺失值 (2)重复性

Python3新特性
字符串格式化输出
新增format()方式

  • 基本语法是通过 {} 和 : 来代替以前的 %在这里插入图片描述
    dict类型变化
    删除之前的iterkeys(),itervalues(),iteritems() 改为keys(),values(),items().

NumPy(Numerical Python)
NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
1,高性能科学计算和数据分析的基础包,提供多维数组对象
2,ndarray,多维数组(矩阵),具有矢量计算能力,快速节省空间
3,矩阵运算,无需循环,可完成类似matlab中的矢量计算
4,线性代数,随机数生成
5,广播功能函数
6,整合 C/C++/Fortran 代码的工具

  • import numpy as np

SciPy
1,在NnmPy库的基础上增加了众多的数学,科学及工程常用的库函数
2,线性代数,常微分方程求解,信号处理࿰

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值