单倍型的相关概念

在这里插入图片描述
同源染色体:同源染色体,一个来自母本,一个来自于父本。

单倍型:单倍体基因型的简称。遗传学上指在单条染色体上一系列遗传变异位点的组合。( 在遗传学上是指在同一染色体上进行共同遗传的多个基因座上等位基因的组合;通俗的说法就是若干个决定同一性状的紧密连锁的基因构成的基因型。按照某一指定基因座上基因重组发生的数量,单倍型甚至可以指至少两个基因座或整个染色体。)

更进一步的讲,单倍型也是指一个染色单体里面具有统计学关联性的一类单核苷酸多态性(SNPs)。一个单倍型内的这类统计学关联性和等位基因的确认被认为是可以明确的识别所有其他多态区域。这些信息对于探查普通疾病的基因学非常有用,也被用于人类单倍体型图计划(HapMap)中。基因在一条染色体上的组合称单元型 (haplotype ,又称单倍型 ) ,在体细胞两条染色体上的组合称基因型,其表达的特异性别称表型。

等位基因(allele):是指位于一对同源染色体相同位置上控制同一性状不同形态的基因。

SNPs: 单核苷酸多态性主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每300个碱基对中就有1个,估计其总数可达300万个甚至更多。SNP是一种二态的标记,由单个碱基的转换或颠换所引起。SNP既可能在基因序列内,也可能在基因以外的非编码序列上。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
什么叫⼤数据⼤数据的概念 1、⼤数据定义 对于"⼤数据"(Big data)研究机构Gartner给出了定义,"⼤数据"是需要新处理模式才能具有更强 的决策⼒、洞察发现⼒和流程优化能⼒ 的海量、⾼增长率和多样化的信息资产。 技术的战略意义不在于掌握庞⼤的数据信息,⽽在于对这些含有意义的数据进⾏专业化处理。换⾔之,如果把⽐作⼀种产业,那么这种产业 实现盈利的关键,在于提⾼对数据的"加⼯能⼒",通过"加⼯"实现数据的"增值"。 从技术上看,⼤数据与的关系就像⼀枚硬币的正反⾯⼀样密不可分。⼤数据必然⽆法⽤单台的计算机进⾏处理,必须采⽤分布式。它的特⾊ 在于对进⾏分布式数据挖掘,但它必须依托的、和、。 随着的来临,⼤数据(Big data)也吸引了越来越多的关注。《》的分析师团队认为,⼤数据(Big data)通常⽤来形容⼀个公司创造的⼤ 量和,这些数据在下载到⽤于分析时会花费过多时间和⾦钱。常和云计算联系到⼀起,因为实时的⼤分析需要像MapReduce⼀样的框架 来向数⼗、数百或甚⾄数千的电脑分配⼯作。 ⼤数据需要特殊的技术,以有效地处理⼤量的容忍经过时间内的数据。适⽤于⼤数据的技术,包括⼤规模(MPP)、数据挖掘电⽹、、分 布式、、互联⽹和可扩展的存储系统。 最⼩的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB,它们按照1024(2 的⼗次⽅)来计算: 8bit= 1Byte 1KB= 1,024 Bytes 1MB= 1,024 KB = 1,048,576 Bytes 1GB= 1,024 MB = 1,048,576 KB 1TB= 1,024 GB = 1,048,576 MB 1PB= 1,024 TB = 1,048,576 GB 1EB= 1,024 PB = 1,048,576 TB 1ZB= 1,024 EB = 1,048,576 PB 1YB= 1,024 ZB = 1,048,576 EB 1BB= 1,024 YB = 1,048,576 ZB 1NB= 1,024 BB = 1,048,576 YB 1 DB = 1,024 NB = 1,048,576 BB 2 1887–1890年 赫尔曼·霍尔瑞斯美国统计学家赫尔曼·霍尔瑞斯为了统计1890年的⼈⼝普查数据发明了⼀台电动器来读取卡⽚上的洞数,该设备让美国⽤ ⼀年时间就完成了原本耗时8年的⼈⼝普查活动,由此在全球范围内引发了数据处理的新纪元。 1935–1937年 美国总统利⽤开展了美国政府最雄⼼勃勃的⼀项数据收集项⽬,IBM最终赢得竞标,即需要整理美国的2600万个员⼯和300万个雇主的记 录。总统候选⼈阿尔夫兰登scoffs嘲笑地说,"要整理如此繁多的,还必须⽽调⽤⼤规模的现场调查⼈员去核实那些信息不完整的⼈员记 录。" 1943年 ⼀家英国⼯⼚为了破译⼆战期间的纳粹密码,让⼯程师开发了系列开创性的能进⾏⼤规模数据处理的机器,并使⽤了第⼀台可编程的电⼦计算 机进⾏运算。该计算机被命名为"巨⼈",为了找出拦截信息中的潜在模式,它以每秒钟5000字符的速度读取纸卡——将原本需要耗费数 周时间才能完成的⼯作量压缩到了⼏个⼩时。破译德国部队前⽅阵地的信息以后,帮助盟军成功登陆了诺曼底。 1997年 研究员迈克尔·和⼤卫·沃斯⾸次使⽤"⼤数据"这⼀术语来描述的挑战:⽣成⼤量的信息——在考克斯和埃尔斯沃斯按案例中,周围的⽓流 ——是不能被处理和可视化的。数据集通常之⼤,超出了、,甚⾄远程磁盘的承载能⼒。"他们称之为"⼤数据问题。" 2002年 在9/11袭击后,美国政府为阻⽌恐怖主义已经涉⾜⼤规模数据挖掘。前约翰·波因德克斯特领导国防部整合现有政府的数据集,组建⼀个⽤ 于筛选通信、犯罪、教育、⾦融、医疗和旅⾏等记录来识别可疑⼈的⼤数据库。⼀年后国会因担忧公民⽽停⽌了这⼀项⽬。 2004年 9/11委员会呼吁反恐机构应统⼀组建"⼀个基于⽹络的信息共享系统",以便能快处理应接不暇的数据。到2010年,的30000名员⼯将 拦截和存储17亿年电⼦邮件、电话和其它通讯⽇报。与此同时,零售商积累关于客户购物和个⼈习惯的⼤量数据,沃尔玛⾃吹已拥有⼀个容 量为460字节的缓存器——⽐当时互联⽹上的数据量还要多⼀倍。 2007–2008年 随着社交⽹络的激增,技术博客和专业⼈⼠为"⼤数据" 概念注⼊新的⽣机。"当前世界范围内已有的⼀些其他⼯具将被⼤量数据和应⽤ 所取代"。《》的认为当时处于⼀个"理论终结时代"。⼀些政府机构和美国的顶尖计算机科学家声称,"应该深⼊参与⼤数据计算的开发和 部署⼯作,因为它将直接有利于许多任务的实现。" 2009年1⽉ 印度政府建⽴印度唯⼀的管理局,对12亿⼈的指纹、照⽚

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值