NumPy类库

'''
NumPy
它不仅是 Python 中使用最多的第三方库,而且还是 SciPy、Pandas 等数据科学的基础库。
它所提供的数据结构比 Python 自身的“更高级、更高效”,可以这么说,NumPy 所提供的数据结构是 Python 数据分析的基础
1. 列表 list 的元素在系统内存中是分散存储的,而 NumPy 数组 Ndarray 存储在一个均匀连续的内存块中
2. 内存访问模式中,缓存会直接把字节块从 RAM 加载到 CPU 寄存器中。
因为数据连续的存储在内存中,NumPy 直接利用现代 CPU 的矢量化指令计算,加载寄存器中的多个连续浮点数。
3. NumPy 中的矩阵计算可以采用多线程的方式,充分利用多核 CPU 计算资源,大大提升了计算效率

提升内存和提高计算资源的利用率: 避免采用隐式拷贝,而是采用就地操作的方式
'''
import numpy as np
a = np.array([1, 2, 3])
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
b[1, 1] = 10
print(a.shape, b.shape, a.dtype)
print(b)

# 结构数组
persontype = np.dtype(
    {'names': ['name', 'age', 'math', 'chinese'],
     'formats': ['S32', 'i', 'f', 'f']})
peoples = np.array([("ZhangFei", 32, 75, 90), ("GuanYu", 24, 85, 88.5),
                    ("ZhaoYun", 28, 85, 96.5), ("HuangZhong", 29, 65, 85)],
                   dtype=persontype)
ages = peoples[:]['age']
print(ages, np.mean(ages))
chinese = peoples[:]['chinese']
print(chinese, np.mean(chinese))

# ufunc 运算
# ufunc 是 universal function 的缩写,它能对数组中每个元素进行函数操作。
# NumPy 中很多 ufunc 函数计算速度非常快,因为都是采用 C 语言实现的

# 连续数组的创建
# arange() 类似内置函数 range(),
# 通过指定初始值、终值、步长来创建等差数列的一维数组,默认是不包括终值的
x1 = np.arange(1, 11, 2)
# linspace 是 linear space 的缩写,代表线性等分向量的含义。
# linspace() 通过指定初始值、终值、元素个数来创建等差数列的一维数组,默认是包括终值的
x2 = np.linspace(1, 9, 5)
print(x1, x2, np.linspace(1, 9, 6))

# 算数运算
print(np.add(x1, x2))
print(np.subtract(x1, x2))
print(np.multiply(x1, x2))
print(np.divide(x1, x2))
# n次方
print(np.power(x1, x2))
# 取余
print(np.remainder(x1, x2))

# 统计函数
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# axis=0: 列; 1: 行
print(np.amin(a), np.amin(a, 0), np.amin(a, 1))
print(np.amax(a), np.amax(a, 0), np.amax(a, 1))

# 统计最大值与最小值之差 ptp()
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 列: 0, 行: 1
print(np.ptp(a), np.ptp(a, 0), np.ptp(a, 1))

# 统计数组的百分位数 percentile()
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 1,4,7=> 25%: 1+(7-1)*25%
print(np.percentile(a, 50), np.percentile(a, 25, 0), np.percentile(a, 50, 1))

# 统计数组中的中位数 median()、平均数 mean()
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 中位数
print(np.median(a), np.median(a, 0), np.median(a, axis=1))
# 平均数
print(np.mean(a), np.mean(a, 0), np.mean(a, axis=1))

# 统计数组中的加权平均值 average()
a = np.arange(1, 5, 1, dtype=int)
wts = np.array([1, 2, 3, 4])
# (1+2+3+4)/4=2.5
# (1*1+2*2+3*3+4*4)/(1+2+3+4)=3.0
print(np.average(a), np.average(a, weights=wts))

# 统计数组中的标准差 std()、方差 var()
# 方差的计算是指每个数值与平均值之差的平方求和的平均值,即 mean((x - x.mean())** 2)。
# 标准差是方差的算术平方根
a = np.linspace(0, 8, 5, dtype=int)
print(a, np.std(a), np.var(a))

# NumPy 排序
# kind 里,可以指定 quicksort、mergesort、heapsort 分别表示快速排序、合并排序、堆排序
#   默认为 quicksort
# axis 默认是 -1,即沿着数组的最后一个轴进行排序,也可以取不同的 axis 轴,
#   或者 axis=None 代表采用扁平化的方式作为一个向量进行排序
#   None: 返回一维数组, 0: 列, 1: 行
a = np.array([[4, 3, 2], [2, 4, 1]])
print(np.sort(a))
print(np.sort(a, axis=None))
print(np.sort(a, axis=0), np.sort(a, axis=1))
print(np.sort(a, kind='quicksort', axis=None),
      np.sort(a, kind='heapsort', axis=None))

# Exercise: 统计全班的成绩
'''
1.用NumPy统计下这些人在语文、英语、数学中的平均成绩、最小成绩、最大成绩、方差、标准差。
2.总成绩排序,得出名次进行成绩输出
'''
scoretype = np.dtype({'names': ['name', 'chinese', 'english', 'math'],
                      'formats': ['S32', 'i', 'i', 'i']})
peoples = np.array(
    [
        ("zhangfei", 66, 65, 30),
        ("guanyu", 95, 85, 98),
        ("zhaoyun", 93, 92, 96),
        ("huangzhong", 90, 88, 77),
        ("dianwei", 80, 90, 90)
    ], dtype=scoretype)
print("科目 | 平均成绩 | 最小成绩 | 最大成绩 | 方差 | 标准差")
courses = {'语文': peoples[:]['chinese'],
           '英文': peoples[:]['english'], '数学': peoples[:]['math']}
for course, scores in courses.items():
    print(course, np.mean(scores), np.amin(scores), np.amax(scores), np.std(scores),
          np.var(scores))
print('Ranking')
ranking = sorted(peoples, key=lambda x: x[1]+x[2]+x[3], reverse=True)
print(ranking)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
NumPy是在python中处理数据的最基本和最强大的包。 如果您打算从事数据分析或机器学习项目,那么对numpy的充分理解几乎是必须的。 其他用于数据分析的软件包(如pandas)是建立在numpy之上,用于构建机器学习应用的scikit-learn软件包也在numpy上运行。 但对于.NET开发人员来说,却没有这样的强大工具库。 虽然有像Deedle和Math.NET这样的开源库,但它们不是很容易使用,也不能借用很多现有的python代码。 NumSharp(Numerical .NET)可以说是C#中的线性代数库。 它是用C#编写的,符合.netstandard 2.0库标准。 它的目标是让.NET开发人员使用NumPy的语法编写机器学习代码,从而最大限度地借鉴现有大量在python代码的转译成本。 NumSharp使用最新的Span技术安全高效地访问内存,优化每个模拟API的性能,确保最底层的NDArray达到最佳性能状态。NumSharp对于在数组上执行数学和逻辑运算非常有用。 它为.NET中的n阵列和矩阵的操作提供了大量有用的功能。 让我们给出一个代码片段来说明如何使用NumSharp。 // 初始化一个NumSharp实例,类名故意叫NumPy var np = new NumPy(); // 产生一个数字0到9的向量 np.arange(10) // 产生一个3维张量 np.arange(12).reshape(2, 3, 2); // 产生10个0到9的随机数,并转换成5*5的矩阵 np.random.randint(low: 0, high: 10, size: new Shape(5, 5)); 上面的代码是不是看起来否非常接近python代码?简直就是如出一辙。NumSharp的目的就是让你可以轻松的复制粘贴Python代码。 如何安装: PM> Install-Package NumSharp   NumSharp 已被如下项目使用: Pandas.NET Bigtree.MachineLearning CherubNLP BotSharp 标签:numpy

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值