传统特征部分代码完成
由于要与传统特征或者称之为手工特征进行对比,我在代码中开了一块专门进行相关的分析。在traditional_desc
的文件夹中。
入口文件
以下是入口文件generate.py
的分析。
首先对相关的feature进行定义,并留存数组用来选择,定义保留ROCdatas,ROCdatas的数组,然后调用util_file.load_fasta
来加载数据集。
def main(featurechoice, config):
nucleotide_feature = ['ANF', 'binary', 'CKSNAP', 'DNC']
protein_feature = ['BLOSUM62', 'CKSAAGP', 'CTDC']
ROCdatas = []
PRCdatas = []
tra_name = []
# Import some data to play with
datapath = config.path_data
# train_data用于训练的样本集, test_data用于测试的样本集, train_label训练样本对应的标签集, test_label测试样本对应的标签集
train_seq, train_label, test_seq, test_label = util_file.load_fasta(datapath)
train_data, test_data