C语言:emsembl GTF文件文本数据截取特定数据然后读入结构体

这段C语言代码用于打开一个ensembl GTF文件,查找包含特定目标(如"Nanog")的行,并将这些行的数据读入自定义的gene结构体中。程序首先创建一个临时文件来存储目标基因的行,然后逐行处理临时文件,通过Tab和空格将数据分隔并存入结构体。结构体包含了基因名称、ID、转录本名称、转录本生物类型和外显子信息。
摘要由CSDN通过智能技术生成

#include <stdio.h>
#include <string.h>
#define _CRT_SECURE_NO_WARNINGS 1
struct gene{
    char genename[10];
    char gene_id[30];
    char transcript_name[20];
    char transcript_biotype[20];
    char transcript_id[30];
    unsigned long int Exon[20];
};//定义结构体

int main()
{
    FILE* fp1=NULL;
    FILE* fp2=NULL;
    char buff[2001]; 
    char* p1=NULL;
    char Target[20]={"\"Nanog\""};
    struct gene Nanog[5];
    int i = 0;
    int j = 0;
    int k = 0;

    fp1 = fopen("D:\\C\\ensembl\\Mus_musculus.GRCm39.104.gtf","r");//接收原始emsembl文件
    fp2 = fopen("D:\\C\\ensembl\\temp.txt","r+");

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值