Pyhon数据分析-Numpy基本操作

本文介绍了Python数据分析库Numpy的基本操作,包括按行计算数组的总和、最小值和最大值,以及累积和。同时,提到了如何使用sklearn加载数据集,如内置的iris数据集,以及从网络获取和读取txt或csv数据的方法。
摘要由CSDN通过智能技术生成
import numpy as np

A = numpy.array([ [],[],[],…]) #numpy数组=矩阵
A[:,1] #取第二列
#创建数组<矩阵>  数组(即矩阵)的维度被称为axes,维数称为 rank
np.arange(num).reshape(m,n) #一维数组转变为(m,n)矩阵
np.linspace  #随机数字矩阵
numpy.zeros((m,n),dtype=int)  #0矩阵
numpy.ones((m,n))  #1矩阵,整形类型
numpy.eye()   #E矩阵/单位矩阵
# ndaaray属性
ndaaray.ndim  #数组维数

ndaaray.shape  #各维大小(n,m)

ndaaray.size #元素总数

ndaaray.dtype #元素类型:numpy.int32, numpy.int16, and numpy.float64

ndarray.itemsize #每个元素占用的字节数。

ndarray.data#指向数据内存
#数组内部运算:加、减、乘、内部运算、转置

np.sum([[0, 1], [0, 5]], axis=0) #axis轴向(0横向,1纵向) 按行叠加

a.min/max((axis=1)   # 获取每一行的最小值/最大值

a.cumsum(axis=1)   # 计算每一行的累积和

#元素值

a.sum() #所有元素之和

a.min()/a.max() #所有元素最小/最大值

#数组索引,切片

a[index1:index2] #index1~2数据

a[index1:index2:间隔num] #按间隔取数据
b[0:5,1] # 每行的第二个元素
#数组遍历
for row in b:
#合并数组
np.vstack((a,b))#垂直方向合并

np.hstack((a,b)) #水平方向合并
#矩阵转置运算
np.transpose()

sklearn:

# 加载数据集

sklearn.datasets.load_iris() #导入sklearn内置数据集

urllib.urlopen(url)  #获取网络数据

numpy.loadtxt(raw_data,delimiter=",") #导入txt/csv数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值