数据挖掘-Numpy简单使用(一)

numpy有时用np 表示(import numpy as np)

  1. 认识N维数组-ndarray属性

    1. 数组属性反映了数组本身固有的信息。

      属性名字属性解释
      ndarray.shape数组维度的元组
      ndarray.ndim数组维数
      ndarray.size数组中的元素数量
      ndarray.itemsize一个数组元素的长度(字节)
      ndarray.dtype数组元素的类型
    2.  dtype是numpy.dtype类型,对于数组来说都有哪些类型
      名称描述简写
      np.bool用一个字节存储的布尔类型(True或False)'b'
      np.int8一个字节大小,-128 至 127'i'
      np.int16整数,-32768 至 32767'i2'
      np.int32整数,-2 31 至 2 32 -1'i4'
      np.int64整数,-2 63 至 2 63 - 1'i8'
      np.uint8无符号整数,0 至 255'u'
      np.uint16无符号整数,0 至 65535'u2'
      np.uint32无符号整数,0 至 2 ** 32 - 1'u4'
      np.uint64无符号整数,0 至 2 ** 64 - 1'u8'
      np.float16半精度浮点数:16位,正负号1位,指数5位,精度10位'f2'
      np.float32单精度浮点数:32位,正负号1位,指数8位,精度23位'f4'
      np.float64双精度浮点数:64位,正负号1位,指数11位,精度52位'f8'
      np.complex64复数,分别用两个32位浮点数表示实部和虚部'c8'
      np.complex128复数,分别用两个64位浮点数表示实部和虚部'c16'
      np.object_python对象'O'
      np.string_字符串'S'
      np.unicode_unicode类型'U'
  2.  基本操作

生成数组

  1. 全0或全1数组
    1. 全0:
      # zeros(shape[, dtype, order]) zeros_like(a[, dtype, order, subok])
      zero = np.zeros([2, 3])
      
      """
      zero 生成结果
      array([[0., 0., 0.],
             [0., 0., 0.]])
      """
      

       

    2. 全1:
      # ones(shape[, dtype, order])
      one = np.ones([2, 3])
      """
      one结果
      array([[1., 1., 1.],
             [1., 1., 1.]])
      """

       

  2. 从现有数组生成
    1. array(object[, dtype, copy, order, subok, ndmin])
    2. asarray(a[, dtype, order])--(相当于拷贝中的浅拷贝当原始数组发生变化对应也发生变化)
    3. copy(a[, order])
  3. 生成固定范围的数组
    1. np.linspace (start, stop, num, endpoint, retstep, dtype)
    2. np.linspace (start, stop, num, endpoint, retstep, dtype)
      """
      start 序列的起始值
      stop 序列的终止值,
      如果endpoint为true,该值包含于序列中
      num 要生成的等间隔样例数量,默认为50
      endpoint 序列中是否包含stop值,默认为ture
      retstep 如果为true,返回样例,
      以及连续数字之间的步长
      dtype 输出ndarray的数据类型
      """
      
      # 生成等间隔的数组
      np.linspace(0, 100, 10)
      # 返回结果
      array([  0.        ,  11.11111111,  22.22222222,  33.33333333,
              44.44444444,  55.55555556,  66.66666667,  77.77777778,
              88.88888889, 100.        ])
      
    3. 其他
      1. numpy.arange(start,stop, step, dtype)
      2. numpy.logspace(start,stop, num, endpoint, base, dtype)
  4. 生成随机数组
    1. 均匀分布
      1. np.random.rand(d0, d1, ..., dn)

        返回[0.0,1.0)内的一组均匀分布的数。

      2. np.random.uniform(low=0.0, high=1.0, size=None)

        功能:从一个均匀分布[low,high)中随机采样,注意定义域是左闭右开,即包含low,不包含high.

        参数介绍:

        low: 采样下界,float类型,默认值为0;

        high: 采样上界,float类型,默认值为1;

        size: 输出样本数目,为int或元组(tuple)类型,例如,size=(m,n,k), 则输出mnk个样本,缺省时输出1个值。

        返回值:ndarray类型,其形状和参数size中描述一致。

      3. np.random.randint(low, high=None, size=None, dtype='l')

        从一个均匀分布中随机采样,生成一个整数或N维整数数组,取数范围:若high不为None时,取[low,high)之间随机整数,否则取值[0,low)之间随机整数。

    2. 正太分布
      1. np.random.randn(d0, d1, …, dn)

        功能:从标准正态分布中返回一个或多个样本值

      2. np.random.normal(loc=0.0, scale=1.0, size=None)

        loc:float

        ​ 此概率分布的均值(对应着整个分布的中心centre)

        scale:float

        ​ 此概率分布的标准差(对应于分布的宽度,scale越大越矮胖,scale越小,越瘦高)

        size:int or tuple of ints

        ​ 输出的shape,默认为None,只输出一个值

      3. np.random.standard_normal(size=None)

        返回指定形状的标准正态分布的数组。

  5. 数组的索引切片
    1. 切片(类似列表切片)[组下标,别表切片]
    2. 索引[组,下标]
  6. 数组去重
    1. ndarray.unique(items) 直接调用unique函数去重
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值