Python数据分析
- 系统:Centos7 Linux
- python版本:python3.6
- 编辑器:nteract
简单介绍一下提示窗口的一些知识点(基础薄弱的可以了解(猿神直接略过)):
f
:函数
c
:class类
I
:属性(方法)
数据分析是要处理TB以上的数据级别的数据:
TB < PB < EB < ZB (数据级依次增加)
Numpy模块
numpy 是python下非常强大的库,用于对多维数组执行计算,可以进行矢量化运算,主要任务进行机器学习,图形处理,数学任务等。
ndarry
:可以理解为是一个多维数组
他的对象有两个约束条件:
- 实际的数据
- 描述数据的元数据。
在这之前讲解一下数据类型的优先级:
str < float < int
numpy模块中常用的一些方法和函数:
导入numpy模块:
import numpy as np
np.ones()
:
##创建一个全为1的1x3的一维数组##
##创建一个全为一的3x5的二维数组##
也可以这样创建:
np.zeros()
同样上述效果创建全为0的数组
np.eye()
:
没错,他实现的就是单位矩阵,学过高数的猿仔就会明白他的作用。
np.array()
:相当于创建一个一维数组
np.arange(start,end,step):
np.reshape(index,cloumns) :
当行或列不确定时用 -1 自动判断
np.ndim
:获取维数
np.shape
:获取维度
数组行、列、单个数据的选取
arr [a : b : c,c : d : e ]
a、c:行
b、d:列
c、e:步长
选取arr数组的行:
选取arr数组的列:
选取arr数组单个数据:
布尔值索引:
数组转置(行列互换):
- 后记:
有需要的朋友可以搜索微信公众号:【知音库】
这里有个人总结的文章,本人是大数据专业学生,
同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。