项目实训-智能生物序列分析平台-后端模块(6)

本文详细介绍了智能生物序列分析平台后端的传统特征部分,包括入口文件和手工特征提取文件的代码分析。讲解了如何定义特征、加载数据集,以及针对DNA的特征提取过程。通过核函数为线性的分类器,利用sklearn进行模型训练和ROC、PR曲线的绘制。同时,简单解析了手工特征提取文件中的ANF函数,展示了如何对生物序列进行统计特征提取。
摘要由CSDN通过智能技术生成

传统特征部分代码完成

由于要与传统特征或者称之为手工特征进行对比,我在代码中开了一块专门进行相关的分析。在traditional_desc的文件夹中。

入口文件

以下是入口文件generate.py的分析。

首先对相关的feature进行定义,并留存数组用来选择,定义保留ROCdatas,ROCdatas的数组,然后调用util_file.load_fasta来加载数据集。

def main(featurechoice, config):
    nucleotide_feature = ['ANF', 'binary', 'CKSNAP', 'DNC']
    protein_feature = ['BLOSUM62', 'CKSAAGP', 'CTDC']

    ROCdatas = []
    PRCdatas = []

    tra_name = []
    # Import some data to play with
    datapath = config.path_data

    # train_data用于训练的样本集, test_data用于测试的样本集, train_label训练样本对应的标签集, test_label测试样本对应的标签集
    train_seq, train_label, test_seq, test_label = util_file.load_fasta(datapath)
    train_data, test_data 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值