生物信息小知识_1_reads.contigs.scaffolds...

生物信息小知识_1_reads.contigs.scaffolds...

 
read :(专业:)高通量测序时,在芯片上的每个反应都会读出相应的一条序列,是比较短的,叫read。
(理解:)reads是原始的数据;raw_reads是测出来的未被clean的reads;raw_reads(raw_data)经过clean之后就变成了clean_reads(clean_data)。
contig:(专业:)很多的reads通过重叠片段(overlap),能够组装成一个更大的片段,这个更大的片段就是contig。
(理解:)通过软件/或其他工具,把有overlap的reads整合到一起,形成的较长序列,就得到了(有 overlap的reads)的一个contig 。
scaffold:(专业:)(基因组de novo测序)通过reads拼接的到contigs之后,往往还需要构建paired-end库或Illumina Mate-pair库,以获得一定大小的片段(如:3kb、6kb等)两端的序列。基于这些序列,可以确定一些contig之间的顺序关系,这些先后顺序已知的contig就组成scaffold。
(理解:)借助于pairend的信息,将相关的(一对)sontigs连起来,中间未知的基因用N表示,这样的到的序列,成为scaffold。
Unigene:(专业:)即unique gene sequence collection——unigene是以自动化的方式,对于每一个新进入到genebank的序列,进行序列相似性的分析,如果可以找到可能来自于同一个基因的基因簇(cluster),则将此序列归入到这一个基因簇,如果找不到,则成立一个新的基因簇。
contig N50: (专业:)reads在拼接之后会获得一些不同长度的contigs。我们将所有的contig的长度相加,获得一个所有Contig的总长度。然后将所有的contig按照长度从大到小的顺序排列,得到contig_1,contig_2,contig_3...contig_n, 再将contig按照这个顺序依次相加,当相加的长度达到总长度的一半时,最后一个加上的contig的长度就是Contig N50 。
(理解:)如果contig1+contig2+contig3<1/2(contig总长);但是contig1+contig2+contig3+contig4>=1/2(contain总长);那么contig4的长度就是contig N50 的值。
注意:
一个contain被组装出来之后,鉴定发现它是编码蛋白质的基因,就叫singleton;
多个contains组装成scaffold之后,鉴定发现它是编码蛋白质的基因,叫unigene;
一个unigene不一定代表一个contain,一个unigene可以有多个contigs。
  • 9
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
MiTeC System Information Component Suite The most complex system information probe in Delphi and FPC/Lazarus world. The cost of a site license with full source codes is currently 110 EUR. TMiTeC_SystemInfo gathers all following components to one for simple use TMiTeC_AD explores ActiveDirectory TMiTeC_APM provides informaton about Advanced Power Management TMiTeC_BT detects Bluetooth devices using Native Bluetooth Enumerator) TMiTeC_CPU provides detailed CPU information TMiTeC_Devices provides devices information like Windows Device Manager TMiTeC_Disk provides logical drive information TMiTeC_Display provides display adapter information TMiTeC_DMA provides direct memory acceess TMiTeC_DriveContent scans and saves specified drive content TMiTeC_Engines provides information about various installed engines TMiTeC_EventLog digs information from Windows EventLog TMiTeC_Firewall enumerates settings and rules from Windows Firewall, rule management functionality TMiTeC_Machine provides informaton about computer or virtual machine, BIOS, TPM etc. TMiTeC_Media provides media devices information TMiTeC_Memory provides memory information TMiTeC_Monitor provides all connected moitors information TMiTeC_MSProduct detects some Microsoft products installed and their product keys TMiTeC_MUS detects available Windows updates (MicrosoftUpdateSession) TMiTeC_Network provides network card info, TCP/IP ad Winsock config, installed protocols, clients and services. TMiTeC_OperatingSystem provides OS detailed information, Locale, Timezone, NT specific info, hotfixes, internet settings etc. TMiTeC_Printers detects installed printers and their properties TMiTeC_ProcessList collects list of running processes, services, drivers and windows and their properties TMiTeC_Security detects installed AntiViruses, AntiSpyware and Firewalls TMiTeC_SMBIOS reads SMBIOS information from memory TMiTeC_Software provides list of installed software TMiTeC_Startup provides list of applications that are starte

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值