第四章
4.1.6 神奇索引
神奇索引
是NumPy中的术语,用于描述使用整数数组进行数据索引,看例子很好明白。
假设有一个8X4的数组:
>>>import numpy as np
>>>arr = np.empty((8,4))
>>>for i in range(8):
arr[i] = i
>>>arr
array([[0., 0., 0., 0.],
[1., 1., 1., 1.],
[2., 2., 2., 2.],
[3., 3., 3., 3.],
[4., 4., 4., 4.],
[5., 5., 5., 5.],
[6., 6., 6., 6.],
[7., 7., 7., 7.]])
为了选出一个特定顺序的子集,可以通过传递一个包含指明顺序的列表或者数组
来完成,在上一节的索引中,传入的是逗号分隔的整数,注意区别。
>>>arr[[4, 3, 0, 6]]
array([[4., 4., 4., 4.],
[3., 3., 3., 3.],
[0., 0., 0., 0.],
[6., 6., 6., 6.]])
如果使用负的索引值,则从尾部进行选择:
>>>arr[[-3, -1, -7]]
array([[5., 5., 5., 5.],
[7., 7., 7., 7.],
[1., 1., 1., 1.]])
当传递多个索引数组时,会根据每个索引数组对应的元素选出一个一维数组:
>>>arr = np.arange(32).reshape((8, 4))
>>>arr
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23],
[24, 25, 26, 27],
[28, 29, 30, 31]])
#元素(1, 0),(5, 3),(7, 1),(2, 2)将被选中
>>>arr[[1, 5, 7, 2], [0, 3, 1, 2]]
array([ 4, 23, 29, 10])
利用神奇索引加切片
可以让我们更加方便的提取数组的子集:
>>>arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]#先提取了一个子集,再进行切片
array([[ 4, 7, 5, 6],
[20, 23, 21, 22],
[28, 31, 29, 30],
[ 8, 11, 9, 10]])
神奇索引与切片不同的是,它会将数据复制到新的数组
中。
4.1.7 数组的转置和换轴
转置是一种特殊的数组重组方式,可以理解行列的转换,返回的是原数组的视图。数组用于transpose
方法,也有特殊的T
属性。
arr = np.arange(15).reshape((3, 5))
>>>arr
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
>>>arr.T
array([[ 0, 5, 10],
[ 1, 6, 11],
[ 2, 7, 12],
[ 3, 8, 13],
[ 4, 9, 14]])
对于更高纬度的数组,transpose
可以接收包含轴编号的元组,用于置换:
>>>arr = np.arange(16).reshape((2,2, 4))
>>>arr
array([[[ 0, 1, 2, 3],
[ 4, 5, 6, 7]],
[[ 8, 9, 10, 11],
[12, 13, 14, 15]]])
#(0,2,1)将第三个轴与第二个轴转置,第一个轴不便。
>>>arr.transpose((0, 2, 1))
array([[[ 0, 4],
[ 1, 5],
[ 2, 6],
[ 3, 7]]
[[ 8, 12],
[ 9, 13],
[10, 14],
[11, 15]]])
数组还有一个swapaxes
的方法,该方法接收一对轴编号作为参数,并对轴调整用于重组数据:
#与上面的效果相同
>>>arr.swapaxes(1, 2)
array([[[ 0, 4],
[ 1, 5],
[ 2, 6],
[ 3, 7]]
[[ 8, 12],
[ 9, 13],
[10, 14],
[11, 15]]])
换轴是任意两个轴可以吗?试一下将第一和第三轴换轴:
>>>arr.swapaxes(0,2)
array([[[ 0, 8],
[ 4, 12]],
[[ 1, 9],
[ 5, 13]],
[[ 2, 10],
[ 6, 14]],
[[ 3, 11],
[ 7, 15]]])
微生物基因组
1,程序化的基因组改变 程序化改变不是由于DNA修复和复制错误,或“自私”DNA元件活动所引发的单一事件,这些变化使其能够对应频繁发生的环境变化,通常赋予细菌一种选择优势。
2,许多确定的程序化改变包括位点特异性重组系统,位点特异性重组酶在特异的靶位点催化DNA交换,在许多经充分研究的系统中,重组导致基因组中相近的两个或多个靶位点的倒置。
3,基因组中可移动遗传元件是基因组发生内在变化的重要原因。细菌基因组中的插入序列是最常见的可移动元件。插入序列的最重要的特点,是在基因组内部不同的位点之间转座(跳跃),它能以一个或多个单位的转座子移动,在某些情况下,侧翼的反向重复序列可移动插入框,可通过反式作用因转座。