自由 平等~忠诚 奉献

生物信息工程师

排序:
默认
按更新时间
按访问量

python-multiprocessing 多进程并行计算

#16.6.1.1. The Process class from multiprocessing import Process import os import time start_time = time.time() def info(title): print(title) ...

2017-08-13 14:59:33

阅读数:5704

评论数:0

R语言 并行处理

具体的不懂,只记录实现 parallel packageR自带的包,可以实现并行处理。library(parallel) detectCores(logical = F) #获得实际核数 cl <- makeCluster(getOption("cl.cores", 4)...

2015-06-17 18:12:58

阅读数:9474

评论数:0

R语言神器

R pacakgedplyr数据处理神器, plyr的升级版,主要用于数据框,可以实现与数据库的快速交互。data.table读取文件,处理数据,速度比python,dplyr还要快。 就是语法上有些凌乱。reshape2, tidyr揉数据的法宝,将数据以不同的形式展现,列数由多变少, tidy...

2015-06-17 18:10:54

阅读数:12807

评论数:0

R语言常用函数集合

meltmelt(data, id.vars, measure.vars, variable.name = "variable", ..., na.rm = FALSE, value.name = "value", factorsAsStrings ...

2015-06-17 18:08:05

阅读数:9619

评论数:0

【深入UCSC Genome Browser】repeats-RepeatMasker

RepeatMasker 是 UCSC Genome Browser的一个track,位于repeats模块。 RepeatMasker(http://www.repeatmasker.org/)是Arian Smit等人开发的程序,可以筛选DNA序列中的散在重复序列( interspersed...

2018-07-08 13:38:58

阅读数:25

评论数:0

【深入UCSC Genome Brower】他山之石

转自:https://mp.weixin.qq.com/s?__biz=MzAwMzY4MTYxNw==&amp;amp;mid=2655752921&amp;amp;idx=1&amp;amp;sn=159f79dde58d2145c59307e23a06b97a&...

2018-07-08 13:22:52

阅读数:31

评论数:0

【深入UCSC Genome Brower】写在前面

UCSC Genome Database(http://genome.ucsc.edu/)是加州大学圣克鲁兹分校(UCSC)创立和维护的一个重要的生物学数据库,它包含了大量基因组数据,基因组间的比对信息, 参考序列(mRNA, EST )、基因注释信息(ENCODE )、表型、表达谱、调控信息、保...

2018-07-08 13:08:02

阅读数:34

评论数:0

Linear Alignment 与 Chimeric Alignment

Linear Alignment An alignment of a read to a single reference sequence that may include insertions, deletions, skips and clipping, but may not inclu...

2018-06-29 11:35:47

阅读数:58

评论数:0

PacBio-组装介绍

主页:github: PacificBiosciences/FALCON转自:https://www.cnblogs.com/leezx/p/5724590.html简介Falcon是一组通过快速比对长reads,从而来consensus和组装的工具。Falcon工具包是一组简单的代码集合,我使用...

2018-03-28 11:33:40

阅读数:745

评论数:1

基因测序仪发展史.

NGS十年发展史,看这篇就够了 | Nature综述解读日前 Nature Reviews Genetics 刊出了一篇综述,盘点近十年来测序技术的发展。从最初的“高山仰止”到如今走进寻常百姓家,正是测序公司和科研人员们孜孜不倦的努力,推动了行业不断向前发展,而其中的佼佼者,也在特定的历史时期留下...

2018-02-02 17:29:09

阅读数:691

评论数:0

【机器学习】图解机器学习十大算法

本文转自 https://mp.weixin.qq.com/s?__biz=MzA3MTIyNzIxOQ==&mid=2655533205&idx=4&sn=1f9d286c2f4874dc97d9e1ee6759d720&chksm=848c5aa9b3fbd3b...

2018-01-19 18:49:32

阅读数:253

评论数:0

【机器学习】分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度

本文转自 http://zhwhong.ml/2017/04/14/ROC-AUC-Precision-Recall-analysis/ 在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。...

2018-01-19 17:43:35

阅读数:1973

评论数:0

【一起学生信】 bwa -M 参数解读

bwa mem 比对时,会有一个 -M 参数,bwa官方给出的解释是 mark shorter split hits as secondary。 -M 参数用来处理同一个reads比对到参考基因组上不同位置的情况。 不加 -M 如果加入 -M 参数,这种情况bam中的 flag= 2048 ...

2018-01-11 18:36:54

阅读数:877

评论数:0

【一起学生信】blast 结果文件处理

本地采用blast比对完成后,会得到一个xml文件,但是xml文件过于复杂,不好处理。我们可以采用biopython将其转换为 blast-tab 文件。 from Bio import SearchIO xml = SearchIO.parse('/your/xml-path/', 'blast...

2018-01-04 11:46:53

阅读数:598

评论数:0

shell小技巧

设置颜色 RED="$(tput setaf 1)" GREEN="$(tput setaf 2)" YELLOW="$(tput setaf 3)" BLUE="$(tput setaf 4)" BOLD=&q...

2018-01-04 11:09:38

阅读数:500

评论数:0

【一起学生信】bam文件统计覆盖深度、靶向捕获效率

bam文件统计覆盖深度、靶向捕获效率是在基因组测序分析中经常用到的操作,之前也用过python、perl实现过但是速度比较慢,今天偶然发现了一个软件bamdst(https://github.com/shiquan/bamdst), 采用c语言编写,速度快,分析的类型也比较多,涉及到了mappin...

2018-01-02 18:23:08

阅读数:1440

评论数:0

肿瘤基因检测的解读流程

从临床进入基因检测流程是入口,检测结果结合临床信息进行合理解读是出口,这一入一出之间需经历检测前临床咨询部分、实验室部分、信息分析部分、临床解读部分共四个环节。其中的第四部分临床解读部分即是根据检测结果、患者信息、医生共识综合判断,临床和遗传咨询有效衔接、充分沟通,最终出具临床解读报告。在做成临床...

2017-12-21 11:27:19

阅读数:2929

评论数:0

Python format 使用实例

如果需要{}是自己实际需要的字符,需要用{{}}作为转义 以下转自: https://pyformat.info/Basic formattingSimple positional formatting is probably the most common use-case. Use it if...

2017-12-12 14:59:25

阅读数:1170

评论数:0

Bash 老司机也可能忽视的 10 大编程细节

Bash,作为大部分 Linux 发行版的出厂预设 Shell,因其晦涩难懂的语法设置,以及需要特别留心的编程细节,几乎成为 Linux 区别于其他操作系统的代名词。针对 Bash 中一些极容易出错的细节,我们在这里总结了 10 条编程注意事项,希望对各位泛 Linux 环境的开发者有所裨益。原文...

2017-12-11 11:24:07

阅读数:1204

评论数:0

层次聚类算法的原理及实现Hierarchical Clustering

层次聚类(HIERARCHICAL CLUSTERING)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法,本篇文章介绍合并方法。

2017-12-06 15:45:49

阅读数:1595

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭