pandas 将 一列 series 一串分成单个字符分成单个字符
原始数据(*.csv)
目的
将gN20_letter 这一列的 基因序列分成单个字母
如:ATGCACTGGAACGAAAACGT
分为:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
A T G C A C T G G A A C G A A A A C G T
操作
df['gN20_letter'].str.split('',expand=True)
解释: 将 series 对象 df[‘gN20_letter’] 转成字符 str 并且切割开来
tips:expand = True
选取两列并且将其中一列分割
plod_1 = pd.concat([plod['G/total'],plod['gN20_letter'].str.split('', expand=True)],axis=1)
plod_1