ped、map;bed、bim、fam 文件初识

生物学习路的开始阶段,需要了解记录基因的相关文件,文件不了解,基因分析完全做不了,开始学习基因文件。

基因文件形式主要分类两大类:

  1. ped + map
  2. bed + bim + fam

第一组:

        在第一组文件中,做基因分析主要用ped文件即可,其中包含了每个个体、个体亲本、表现型、基因型在内的所有信息,map包含了ped中基因型的所有位置信息,该组数据方便人的阅读,但是在机器分析中运算速度低,不便于计算机使用。

        ped(pedigree)文件 

FIDIIDPIDMIDSexPrs1rs2rs3
110021CTAGAA
220010CCAA

AC

Family IDIndividual IDPaternal IDMaternal IDSexPhenotypeGenotypes......
家族ID个人ID父亲ID母亲ID性别表型基因型

        map文件

chrsnp identifiermorgansbp units
染色体snp标识基因距离碱基距离
1rs101000
1rs301001

第二组:

        该组文件主要是用于数据处理,bed文件是最大的文件,包含了最全的信息,计算机处理该文件速度较快,常用该组数据对基因数据进行分析。

        bed文件:二进制文件,打开看不懂。

        bim文件:

chrsnp identifier摩尔距离物理距离次要等位基因主要等位基因
1rs1 010000c
2rs301001GA

        fam(family)文件:包括了家庭信息文件

FIDIIDPIDMIDSexP
家族ID个人ID父亲ID母亲ID性别表型
110000        0011
1100010012

文件转换:

# ped/map 转换为 bed/bim/fam:
plink --file snp --make-bed --out snp_test

# bed/bim/fam  转换为  ped/map
plink --bfile snp_test --recode --out snp

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值