zhu_si_tao的博客

计算机 生物

sam文件学习1

1.FLAG说明 Each bit in the FLAG field is defined as: 0x0001 p the read is paired in sequencing 0x0002 P the read is mapped in a proper pair 0x0004 u ...

2017-10-30 12:45:37

阅读数 291

评论数 0

python,perl和R模块的安装

Python,Perl和R,作为生物信息的主要语言,应用十分广泛;主要原因就是这三种语言有丰富的包,这些包可以运用特定的方法,实现特定的功能! 一.Python python 是这三种的支持面向对象最好的语言,第三方包也是最多的。 1.Python包安装方式一 pip install pa...

2017-09-04 13:13:10

阅读数 2131

评论数 0

SGE集群使用

一、基本用法 SGE工作流程: 接受用户投放的任务 在任务运行以前,将任务放到一个存储区域 发送任务到一个执行设备,并监控任务的运行 运行结束写回结果并记录运行日志 常用的SGE命令: 1. 投递任务到指定队列all.q 方法一: qsub -cwd -l vf=*G -q all...

2017-08-24 16:45:32

阅读数 1059

评论数 0

群体遗传学---admixture软件快速群体分群

群体遗传学中测的很多个个体,得到了最终的SNP vcf文件,需要将其分成群体,看那几个物种聚在一起,一般使用的软件就是STRUCTURE,但是STREUTURE运行速度极慢,后面frappe软件提升了速度,但是也不是很快;admixture凭借其运算速度,成为了主流的分析软件。 admixture...

2017-08-22 16:18:08

阅读数 5834

评论数 4

轻松看懂机器学习十大常用算法

通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。  以后有时间再对单个算法做深入地解析。 今天的算法如下: 决策树随机森林...

2017-08-15 13:36:20

阅读数 209

评论数 0

用U盘安装Linux图解

一般如果需要安装Linux都是使用光盘安装,即将网上下载的ISO文件刻录到光盘中,然后设置BIOS用光盘引导即可; 我们是否可以使用U盘进行Linux安装呢? 答案是可以,我们可以使用UltraISO将ISO文件刻录到U盘中,然后利用U盘引导即可;   优点:不需要刻录光盘;  ...

2017-08-15 13:32:54

阅读数 166

评论数 0

机器学习入门:线性回归及梯度下降

本文会讲到: (1)线性回归的定义 (2)单变量线性回归 (3)cost function:评价线性回归是否拟合训练集的方法 (4)梯度下降:解决线性回归的方法之一 (5)feature scaling:加快梯度下降执行速度的方法 (6)多变量线性回归 Linear Regr...

2017-08-15 13:07:54

阅读数 189

评论数 0

Scala定义函数的5种方式

大数据spark的源码是用Scala来开发的,因此学习Scala来开发spark会更加便捷。 scala中第一函数的集中方式如下: 1.规范化写法,scala 函数的返回值是最后一行代码; def addInt(a:Int,b:Int) : Int = { var total : Int ...

2017-07-31 11:36:46

阅读数 13784

评论数 3

三台台式机组装成hadoop集群

目的:将三台普通的台式机组装成为,hadoop集群,供大数据开发测试。 材料:三台台式机,centos7 安装包(利用USBWriter做一个安装镜像),Java,hadoop安装包 步骤: 1.集群规划 主机名 ip                         安装的软件 进程 maste...

2017-07-17 17:52:56

阅读数 252

评论数 0

Mac安装hadoop伪分布式

目录 一、 下载jdk 二、 配置Hadoop 三、 配置ssh,无密码登录 四、 启动hadoop 五、 环境配置 一. 下载jdk 选择最新版本下载,地址:http://www.oracle.com/technetwork/java/javase/download...

2017-07-11 13:02:39

阅读数 270

评论数 0

Annovar 软件注释流程

第一步:下载Annovar 上Annovar官网下载(http://annovar.openbioinformatics.org/en/latest/user-guide/download/),现在要邮件注册后才能下载。邮件注册后会给你最新版软件下载地址, 下载后文件为annovar....

2017-07-06 11:15:21

阅读数 1519

评论数 0

numpy中的常用函数

Python的numpy包用来进行矩阵计算,该包的几个主要函数如下(持续更新中): 1.met()用来将数组转化为矩阵 2.shape()用来读取矩阵的长度 3.transpose()用来转置矩阵

2017-07-05 16:45:23

阅读数 202

评论数 0

群体遗传学--华伦德效应(Wahlund effect)

群体遗传学中,假定生物由一系列地方群体构成,每个地方群体都符合理想群体的条件,但是不同地方群体中等位基因的频率不同,如果将这些地方群体是为一个整体,那么整体中等位基因的频率等于各地方群体中等位基因频率的平均值;但是按照Hardy-Weinberg法则估算的整个群体中纯合体的频率比各地方群体中的纯合...

2017-06-27 15:45:24

阅读数 2793

评论数 1

Windows中python机器学习numpy,scipy,matplotlib的安装

Python在数据处理方面有很多包,本文是在Python机器学习基本包的安装 1.Python安装 官网上下载相应机器的Python安装包,本文采用Python27 https://www.python.org/ftp/python/2.7.13/python-2.7.13.amd64.ms...

2017-05-11 15:06:37

阅读数 509

评论数 0

群体遗传学--Fst指数

群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。 Fst指数,由F统计量演变而来。F统计量(FIS,FIF,FST)主要有三种。 Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量, 基因差异分化系数(gene differentiation co...

2017-05-10 00:08:52

阅读数 15929

评论数 3

群体遗传学--近交系数

群体遗传学中,经常提到群体间自由交配,但是实际中,群体间经常会发生近亲交配,特别上在植物群体中; 因此,为了衡量群体的近交程度,近交系数诞生了。近交群体的近交程度,常用群体的平均近交系数度量。 二倍体的平均近交系数是指:从群体中随机抽取一个体携带的两个等位基因是同源的概率。 假定二倍体群体中等位基...

2017-05-09 16:25:56

阅读数 5191

评论数 0

群体遗传学--哈温定律

群体遗传学中哈迪-温伯格定律的主要内容是指:在理想状态下,各等位基因的 频率和等位基因的基因型频率在遗传中是稳定不变的,即保持着基因平衡。 ①种群足够大;②种群个体间随机交配;③没有突变;④没有选择;⑤没有迁移;⑥没有遗传漂变 数学证明: 假定群体数量很大: 本次世代 雄性三种基因...

2017-05-09 16:11:38

阅读数 1309

评论数 0

群体遗传学瓶颈效应bottleneck effect

瓶颈是指生物世代交替的过程中,大群体发生奔溃crash,导致群体内个体数目和遗传变异严重丢失。由于群体经历了瓶颈作用,再扩展到原来大小时,群体中等位基因的频率发生波动,这种效应称为瓶颈效应bottleneck effect。群体经历瓶颈后可能快速重新扩张到原来群体的个体数目,但是群体遗传变异水平不...

2017-05-03 11:46:22

阅读数 4589

评论数 0

SOAP 比对解释

SOAP2是SOAP的升级版本,提高了短序列比对的运行速度和精度,同时SOAP2的一个重要改进是支持不同长度的读长。 使用步骤: 1.用2bwt-builder对fa文件建立索引 使用方法:2bwt-builder <sequence file> 2.将...

2017-05-03 11:19:07

阅读数 1797

评论数 2

生物信息实用数据库与论坛

生物信息借助计算机的力量,发展的越来越快,生物数据指数级的增长,带来了大量数据库和论坛的诞生; 本文介绍一些可用的数据库和生物信息论坛: 一.实用论坛: 提问解决困难的好地方 1. SEQanswers http://seqanswers.com/ 2. BioStars  https:...

2017-05-02 15:55:25

阅读数 767

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭