Python数据分析篇--NumPy--入门

 我什么也没忘,但是有些事只适合收藏。不能说,也不能想,却又不能忘。       -- 史铁生 《我与地坛》

NumPy相关知识

1. NumPy,全称是 Numerical Python,它是目前 Python 数值计算中最重要的基础模块。

2. NumPy 是针对多维数组的一个科学计算模块,这个模块封装了很多数组类型的常用操作。

3. NumPy 中最重要的对象是多维数组。

创建多维数组 

1. 将一个列表作为参数传入 numpy 中的 array() 方法即可创建一个多维数组。

2. 我们也可以使用 numpy 中的 ones() 方法或者 zeros() 方法。

3. np.ones() 和 np.zeros() 的参数用于指定生成的多维数组里有多少个元素。

4. 默认生成的是浮点数,numpy 会省略小数点后的 0,因此 1.0 和 0.0 变成了 1. 和 0.。

5. 如果我们想要生成整数的话,可以传入 dtype='类型' 来指定类型。

5. 一般我们使用 import numpy as np ,即用 np 来简写 numpy。

import numpy as np
list=np.array([1,2,3])
print(list)
print(type(list))
#输出结果
#[1 2 3]
#<class 'numpy.ndarray'>

one=np.ones(5)
print(one)
print(type(one))
#[1. 1. 1. 1. 1.]
#<class 'numpy.ndarray'>

zero=np.zeros(3)
print(zero)
print(type(zero))
#[0. 0. 0.]
#<class 'numpy.ndarray'>

one=np.ones(5,dtype='int')
print(one)
print(type(one))
#输出结果 [1 1 1 1 1]

 多维数组的加减乘除

1. 列表间只有加法操作,作用是将两个列表的元素合并在一起。

2. 而多维数组间可以进行加减乘除的四则运算。

3. 运算规则也很简单:将两个数组中对应位置的元素一一进行运算。

import numpy as np

data = np.array([1, 2])
ones = np.ones(2)
print(data + ones)
#最终输出 [2. 3.]

data = np.array([1, 2])
print(data + 1)
# 输出:[2 3]

多维数组的索引

1. 多维数组的索引与字符串、列表的索引规则相同。

data = np.array([1, 2, 3])
print(data[0])
#输出 1

 多维数组的分片

1. 多维数组的分片与字符串、列表的分片规则相同。

2. data[m : n] ,分片是左闭右开区间,即包含 m 不包含 n。

3. 冒号前后的值是可以省略的:省略后冒号前默认为 0,冒号后默认为列表的长度。

4. 对列表分片后的数据进行更改不会影响原数据,但对多维数组分片后的数据进行更改会影响到原数据。

5. 分片支持传入第三个参数——步长,即分片时每隔几个数据取一次值。步长的默认值为 1,当步长为负数时,会将顺序反转。

data = np.array([1, 2, 3])
print(data[0:2])  # 获取索引为 0 和 1 的元素
# 输出:[1 2]

data = np.array([1, 2, 3])
# 获取前 2 个元素
print(data[:2])
# 输出:[1 2]

# 获取后 2 个元素
print(data[-2:])
# 输出:[2 3]

# 获取所有元素
print(data[:])
# 输出:[1 2 3]

lst_data = [1, 2, 3]
lst_data2 = lst_data[:]
lst_data2[0] = 6
print(lst_data)
# 输出:[1, 2, 3]

arr_data = np.array([1, 2, 3])
arr_data2 = arr_data[:]
arr_data2[0] = 6
print(arr_data)
# 输出:[6 2 3]

data = np.array([1, 2, 3, 4, 5, 6])
print(data[::2])  # 省略前两个参数
# 输出:[1 3 5]

data = np.array([1, 2, 3, 4, 5, 6])
print(data[::-1])  # 省略前两个参数
# 输出:[6 5 4 3 2 1]

简单的数据分析

集中趋势

1. 集中趋势所反映的是一组数据所具有的共同趋势,它代表了一组数据的总体水平。

2. 其常用指标有平均数、中位数和众数。

离中趋势

1. 离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)的趋势。

2. 其常用指标有极差、方差和标准差。

3. 极差是一组数据的最大值减去最小值得到的,反应了数据变动的最大范围。

4. 方差和标准差都能反映数据的离散程度,也就是数据的波动程度。方差和标准差的值越小,说明数据越稳定。 

数据分析操作方法 

 1. 在 numpy 上调用对应函数并传入数据如:np.std(data)。

import numpy as np

player1 = np.array([4, 16, 5, 8, 11, 40, 4, 12, 23, 13])
player2 = np.array([9, 8, 12, 11, 9, 10, 13, 10, 11, 13])
player3 = np.array([4, 6, 8, 5, 6, 7, 6, 5, 8, 6])
print("1号玩家平均数",np.median(player1))
print("2号玩家平均数",np.median(player2))
print("3号玩家平均数",np.median(player3))
print("1号玩家方差",np.std(player1))
print("2号玩家方差",np.std(player1))
print("3号玩家方差",np.std(player1))

#输出结果
#1号玩家平均数 11.5
#2号玩家平均数 10.5
#3号玩家平均数 6.0
#1号玩家方差 10.44222198576529
#2号玩家方差 10.44222198576529
#3号玩家方差 10.44222198576529

致谢

 感谢您花时间阅读这篇文章!如果您对本文有任何疑问、建议或是想要分享您的看法,请不要犹豫,在评论区留下您的宝贵意见。每一次互动都是我前进的动力,您的支持是我最大的鼓励。期待与您的交流,让我们共同成长,探索技术世界的无限可能!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值