自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zhu_si_tao的博客

计算机 生物

  • 博客(11)
  • 收藏
  • 关注

原创 Windows中python机器学习numpy,scipy,matplotlib的安装

Python在数据处理方面有很多包,本文是在Python机器学习基本包的安装1.Python安装官网上下载相应机器的Python安装包,本文采用Python27https://www.python.org/ftp/python/2.7.13/python-2.7.13.amd64.msi2.pip安装安装Python是勾选pip安装即可3.numpy安装在网站htt

2017-05-11 15:06:37 643

原创 群体遗传学--Fst指数

群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。Fst指数,由F统计量演变而来。F统计量(FIS,FIF,FST)主要有三种。Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation coefficient,Gst)。假定有s个地方群体,第k个地方群体相对大小为wk,第k个地方群体

2017-05-10 00:08:52 38790 4

原创 群体遗传学--近交系数

群体遗传学中,经常提到群体间自由交配,但是实际中,群体间经常会发生近亲交配,特别上在植物群体中;因此,为了衡量群体的近交程度,近交系数诞生了。近交群体的近交程度,常用群体的平均近交系数度量。二倍体的平均近交系数是指:从群体中随机抽取一个体携带的两个等位基因是同源的概率。假定二倍体群体中等位基因A和a频率分别为p,q,平均近交系数为F,群体中任何个体携带的一对等位基因必然存在或同源,

2017-05-09 16:25:56 16214

原创 群体遗传学--哈温定律

群体遗传学中哈迪-温伯格定律的主要内容是指:在理想状态下,各等位基因的频率和等位基因的基因型频率在遗传中是稳定不变的,即保持着基因平衡。①种群足够大;②种群个体间随机交配;③没有突变;④没有选择;⑤没有迁移;⑥没有遗传漂变数学证明:假定群体数量很大:本次世代雄性三种基因型:AA Aa aa P(AA) = PmP(Aa) = QmP(aa) = Rm雌性

2017-05-09 16:11:38 5632 1

转载 群体遗传学瓶颈效应bottleneck effect

瓶颈是指生物世代交替的过程中,大群体发生奔溃crash,导致群体内个体数目和遗传变异严重丢失。由于群体经历了瓶颈作用,再扩展到原来大小时,群体中等位基因的频率发生波动,这种效应称为瓶颈效应bottleneck effect。群体经历瓶颈后可能快速重新扩张到原来群体的个体数目,但是群体遗传变异水平不可能恢复大原来的水平,直到通过基因突变或基因流,才能恢复到原来群体的遗传变异水平。当一个群体发生瓶颈效

2017-05-03 11:46:22 28108

转载 SOAP 比对解释

SOAP2是SOAP的升级版本,提高了短序列比对的运行速度和精度,同时SOAP2的一个重要改进是支持不同长度的读长。使用步骤:1.用2bwt-builder对fa文件建立索引使用方法:2bwt-builder <sequence file>2.将reads与序列进行比对SE:/Soap/soap2.21release/soap –a  <reads_a>  -D ...

2017-05-03 11:19:07 3933 2

原创 生物信息实用数据库与论坛

生物信息借助计算机的力量,发展的越来越快,生物数据指数级的增长,带来了大量数据库和论坛的诞生;本文介绍一些可用的数据库和生物信息论坛:一.实用论坛:提问解决困难的好地方1. SEQanswers http://seqanswers.com/2. BioStars  https://www.biostars.org/3. https://stackoverflow.com/

2017-05-02 15:55:25 1358

原创 shell中sed

sed:Stream EDitor流式编辑器,一次处理一行的内容。用法:sed [options] 'command' file(s)              sed [options] -f scriptfile file(s) 选项:-d 删除:cat test.file |sed ‘1,2‘ d ##删除文件的前两行,放在引号的里面和外面都可以sed '/^$/d' f

2017-05-02 12:30:51 516

转载 多重假设检验与Bonferroni校正、FDR校正

总结起来就三句话:(1)当同一个数据集有n次(n>=2)假设检验时,要做多重假设检验校正(2)对于Bonferroni校正,是将p-value的cutoff除以n做校正,这样差异基因筛选的p-value cutoff就更小了,从而使得结果更加严谨(3)BH校正是对每个p-value做校正,转换为q-value。q=p*n/rank,其中rank是指p-value从小到大排序后的次序。

2017-05-02 12:29:34 106550 10

转载 两列样本的差异基因筛选

两列样本数据的差异基因筛选方法:FoldChange法+FDR控制其中,FDR值的计算方法如下:1)对每个基因进行p-value的计算假设观测到基因A对应的reads数为x,已知在一个大文库中,每个基因的表达量只占所有基因表达量的一小部分,在这种情况下,p(x)的分布服从泊松分布。已知样本一中唯一比对到基因组的总reads数为N1,样本二中唯一比对到基因组的总reads数为N2,样

2017-05-02 12:28:18 10547 1

原创 R studio常用命令行操作

R 语言的著名的开发应用Rstudio常用的命令行命令:1. 读取和改变目录dir():列出当前目录下的文件,相当于Linux下 ls 命令;getwd():显示当前目录,相当于Linux下 pwd 命令;setwd():改变目录,相当于Linux下的 cd 命令;2.对象管理ls() :列出当前R环境的所有对象;rm(objector 1):删除特定的对象;rm (l

2017-05-01 21:07:01 6879

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除