利用python进行数据分析(十二)

第四章

4.1.6 神奇索引

神奇索引是NumPy中的术语,用于描述使用整数数组进行数据索引,看例子很好明白。
假设有一个8X4的数组:

>>>import numpy as np
>>>arr = np.empty((8,4))
>>>for i in range(8):
	   arr[i] = i
>>>arr
array([[0., 0., 0., 0.],
       [1., 1., 1., 1.],
       [2., 2., 2., 2.],
       [3., 3., 3., 3.],
       [4., 4., 4., 4.],
       [5., 5., 5., 5.],
       [6., 6., 6., 6.],
       [7., 7., 7., 7.]])

为了选出一个特定顺序的子集,可以通过传递一个包含指明顺序的列表或者数组来完成,在上一节的索引中,传入的是逗号分隔的整数,注意区别。

>>>arr[[4, 3, 0, 6]]
array([[4., 4., 4., 4.],
       [3., 3., 3., 3.],
       [0., 0., 0., 0.],
       [6., 6., 6., 6.]])

如果使用负的索引值,则从尾部进行选择:

>>>arr[[-3, -1, -7]]
array([[5., 5., 5., 5.],
       [7., 7., 7., 7.],
       [1., 1., 1., 1.]])

当传递多个索引数组时,会根据每个索引数组对应的元素选出一个一维数组:

>>>arr = np.arange(32).reshape((8, 4))
>>>arr
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])
 #元素(1, 0),(5, 3),(7, 1),(2, 2)将被选中
>>>arr[[1, 5, 7, 2], [0, 3, 1, 2]]
array([ 4, 23, 29, 10])

利用神奇索引加切片可以让我们更加方便的提取数组的子集:

>>>arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]#先提取了一个子集,再进行切片
array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

神奇索引与切片不同的是,它会将数据复制到新的数组中。

4.1.7 数组的转置和换轴
转置是一种特殊的数组重组方式,可以理解行列的转换,返回的是原数组的视图。数组用于transpose方法,也有特殊的T属性。

arr = np.arange(15).reshape((3, 5))
>>>arr
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
>>>arr.T
array([[ 0,  5, 10],
       [ 1,  6, 11],
       [ 2,  7, 12],
       [ 3,  8, 13],
       [ 4,  9, 14]])

对于更高纬度的数组,transpose可以接收包含轴编号的元组,用于置换:

>>>arr = np.arange(16).reshape((2,2, 4))
>>>arr
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]],
        
       [[ 8,  9, 10, 11],
        [12, 13, 14, 15]]])
#(0,2,1)将第三个轴与第二个轴转置,第一个轴不便。
>>>arr.transpose((0, 2, 1))
array([[[ 0,  4],
        [ 1,  5],
        [ 2,  6],
        [ 3,  7]]

       [[ 8, 12],
        [ 9, 13],
        [10, 14],
        [11, 15]]])

数组还有一个swapaxes的方法,该方法接收一对轴编号作为参数,并对轴调整用于重组数据:

#与上面的效果相同
>>>arr.swapaxes(1, 2)
array([[[ 0,  4],
        [ 1,  5],
        [ 2,  6],
        [ 3,  7]]

       [[ 8, 12],
        [ 9, 13],
        [10, 14],
        [11, 15]]])

换轴是任意两个轴可以吗?试一下将第一和第三轴换轴:

>>>arr.swapaxes(0,2)
array([[[ 0,  8],
        [ 4, 12]],

       [[ 1,  9],
        [ 5, 13]],

       [[ 2, 10],
        [ 6, 14]],

       [[ 3, 11],
        [ 7, 15]]])

微生物基因组

1,程序化的基因组改变 程序化改变不是由于DNA修复和复制错误,或“自私”DNA元件活动所引发的单一事件,这些变化使其能够对应频繁发生的环境变化,通常赋予细菌一种选择优势。
2,许多确定的程序化改变包括位点特异性重组系统,位点特异性重组酶在特异的靶位点催化DNA交换,在许多经充分研究的系统中,重组导致基因组中相近的两个或多个靶位点的倒置。
3,基因组中可移动遗传元件是基因组发生内在变化的重要原因。细菌基因组中的插入序列是最常见的可移动元件。插入序列的最重要的特点,是在基因组内部不同的位点之间转座(跳跃),它能以一个或多个单位的转座子移动,在某些情况下,侧翼的反向重复序列可移动插入框,可通过反式作用因转座。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值