自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

转载 轻松了解机器学习

通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。以后有时间再对单个算法做深入地解析。今天的算法如下:决策树随机森林算法逻辑回归SVM朴素贝叶斯K最近邻算法K均值算法...

2018-11-23 13:18:00 95

转载 data.table包使用总结

装载作者:kicilove 来源:CSDN 原文:https://blog.csdn.net/kicilove/article/details/76060980?utm_source=copy data.table包使用总结R中的data.table包提供了一个data.frame的高级版本,让你的程序做数据整型的运算速度大大的增加。data.table已经在金融,基因工程...

2018-10-15 10:10:00 212

转载 使用maftools分析TMB和MATH

本文出自于http://www.bioinfo-scrounger.com之前大致了解了些免疫疗法的相关内容,最近一篇文章深度长文:一文尽览PD-1/PD-L1/CTLA-4肿瘤免疫治疗分子标志物大全概括性的讲述了一些现在免疫疗法中生物标志物的相关内容,值得仔细看一看先总结下其中一些感兴趣的内容:最近几年PD-1/PD-L1在一些肿瘤免疫治疗中的突破性的进展令人鼓舞,这也推进...

2018-10-10 17:13:00 1388

转载 STAR对RNA seq进行map

STAR 本文出自于http://www.bioinfo-scrounger.com第一次听说START这款比对软件是因为其是ENCODE计划的御用软件,ENCODE计划(ENCyclopedia Of DNA Elements)又称人类基因组DNA元件百科全书计划,是2003年在人类基因组计划完成之后紧接着的又一个大型国际科研项目。第二次听说则的由于Gaining compre...

2018-10-10 17:12:00 480

转载 R语言中的生存分析

本文出自于http://www.bioinfo-scrounger.com生存分析是研究生存时间的分布规律,以及生存时间和相关因素之间关系的一种统计分析方法其主要应用领域:Cancer studies for patients survival time analyses(临床癌症上病人生存分析)Sociology for “event-history analysi...

2018-10-10 15:57:00 3278

转载 如何写论文,如何在顶级杂志发表论文?

对于大多数科研人员来说,做科研需要技巧时间和大脑,但是当我们在完成课题并准备投稿时,另一个问题又出现了,到底什么怎么样才能在心仪的杂志上发表自己的论文呢?以下是鲁白先生的经验和感悟(2002年9月25日在复旦大学上海医学院的讲课录音记录)我是上医的校友,80年代中期在上医,然后出国多年,很惭愧到上医的机会很少,跟大家没有太多的交流。今天我讲的题目不太容易讲,第一是本人工作做得...

2018-10-10 15:17:00 310

转载 距离的计算

在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。  本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距离5. 标准...

2018-04-26 10:42:00 108

转载 R语言数据框中,用0替代NA缺失值

1、用0替代数据框中的缺失值NA生成数据框:> m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)> d <- as.data.frame(m) V1 V2 V3 V4 V5 V6 V7 V8 V9 V101 4 3 NA 3 7 6 6 10 6 ...

2018-03-20 09:00:00 1023

转载 samtools manu

SYNOPSISsamtools view -bt ref_list.txt -o aln.bam aln.sam.gzsamtools sort -T /tmp/aln.sorted -o aln.sorted.bam aln.bamsamtools index aln.sorted.bamsamtools idxstats aln.sorted.bamsamtoo...

2017-11-08 11:01:00 1026

转载 各种文件的格式

General formatsAxt formatBAM formatBED formatBED detail formatbedGraph formatbarChart and bigBarChart formatbigBed formatbigGenePred table formatbigPsl table formatbigMa...

2017-11-02 15:55:00 436

转载 pysam

IntroductionPysam is a python module that makes it easy to read and manipulate mapped short read sequence data stored in SAM/BAM files. It is a lightweight wrapper of the htslib C-API.This ...

2017-08-28 10:45:00 632

转载 pysam读取bam files[转载]

pysam - 多种格式基因组数据(sam/bam/vcf/bcf/cram/…)读写与处理模块(python)在开发基因组相关流程或工具时,经常需要读取、处理和创建bam、vcf、bcf 文件。目前已经有一些主流的处理此类格式文件的工具,如samtools、picard、vcftools、bcftools,但此类工具集成的大多是标 准功能,在编程时如果直接调用的话往往显得不够灵...

2017-08-24 21:45:00 476

转载 曼哈顿图[转载]

众多周知,R语言提供了各种各样的包,方便实现我们的目的,下面给大家介绍一个可以便捷的画曼哈顿图的包:qqmaninstall.packages(“qqman”) #安装包library(“qqman”) #加载包data(package=“qqman”) # 查看qqman包中的测试数据,此包中包含gwasResults snpsOfInterest 两个测试数据...

2017-08-22 14:01:00 231

转载 关于在shell中直接修改文件名

在shell命令行可以直接批量修改文件名,如chengyanchun_cfDNA1.vcf chenyanshu_cfDNA1.vcf chibo_WBC.vcf gaomin_cfDNA1.vcf huyuzhen_WBC.vcf liudianying_cfDNA1.vcf quhui_cfDNA2.vcfchengyanchun_cfD...

2017-07-10 15:52:00 190

转载 Linux怎样将文本行倒序排列

1. 命令方法: nl filename | sort -nr | cut -f2 这个方法很unix风格,使用多命令组合完成某种功能是典型的unix特点 单命令: 在linux下,首先想到的就是 tac命令 ,可将文本文件的文本行倒序排列输出 2. AWK方法:awk '{line[NR]=$0}END{for(i=NR;i>0;i-...

2017-07-06 10:32:00 185

转载 用Annovar注释非人类基因组,如小鼠mm9

annovar一般只包含人类基因组注释数据库,其他的物种如小鼠需要自己进行建立注释信息。第一步:下载annovar软件上Annovar官网下载(http://annovar.openbioinformatics.org/en/latest/user-guide/download/),现在要邮件注册后才能下载。邮件注册后会给你最新版软件下载地址,下载后文件为annovar.latest...

2017-07-03 21:19:00 600

转载 shell中的##*,%%*问题

假设我们定义了一个变量为:file=/dir1/dir2/dir3/my.file.txt可以用${ }分别替换得到不同的值:${file#*/}:删掉第一个 /及其左边的字符串:dir1/dir2/dir3/my.file.txt${file##*/}:删掉最后一个 / 及其左边的字符串:my.file.txt${file#*.}:删掉第一个 . 及其左...

2017-07-03 14:37:00 180

转载 BEAMing技术

数字PCR(digital polymerase chain reaction,dPCR)作为DNA定量的新技术,实现了单分子DNA绝对定量。dPCR是将单个DNA样品反应液分别进行数以百计的反应,并且每个反应分别进行扩增检测. 此技术在临床诊断、转基因成分定量、单细胞基因表达、环境微生物检测和下一代测序等方面的研究发挥了重要作用。BEAMing技术:结合了数字PCR以及流式技术,最早是...

2017-06-29 23:56:00 232

转载 Annovar注释说明【转载自http://blog.csdn.net/u013816205/article/details/51262289】

ANNOVAR是一个perl编写的命令行工具,能在安装了perl解释器的多种操作系统上 执行。允许多种输入文件格式,包括最常被使用的VCF格式。输出文件也有多种格式,包括注释过的VCF文件、用tab或者逗号分隔的text文件。 ANNOVAR能快速注释遗传变异并预测其功能。类似的variants注释软件还有VEP, snpEff, VAAST, AnnTools等等.ANNOV...

2017-06-22 13:37:00 304

转载 关于深度学习【转载自http://www.dlworld.cn/XueXiSuanFa/3842.html】

文|邓凯   数据分析重要性  越来越多的管理者意识到数据分析对经济发展、企业运营的重要意义。  在古代,得琅琊阁者得天下 现在,得大数据者得天下。  我总结的数据分析五步走:  1、锁定分析目标,梳理思路,叫纸上谈兵;  2、把杂乱的数据整理出图表报表,用数据探业务,叫自问数答;  3、锁定核心抓重点,设定最终算法,叫挟天子以令诸侯;  4、梳理...

2017-06-21 20:43:00 118

转载 在python中将一个文件的某列替换另一个文件的某列

因为我们测序的时候,引物用的是hg19作为参考序列的,但是就目前来说,hg38注释信息更为丰富。因此,我们决定将call出来的hg19的snv位点转化为hg38,进而用annovar进行注释。之前有一篇转载的博文,就如何将不同类型的参考基因组进行转换。我们用已经转化好的bed(chrom,start,end,***)文件去替换用varscan call 出来的位点信息就好。脚本如下,...

2017-06-21 16:34:00 382

转载 用python计算文件行数[装载自http://www.centoscn.com/python/2013/0806/1110.html]

一、计算文件的行数 最简单的办法是把文件读入一个大的列表中,然后统计列表的长度.如果文件的路径是以参数的形式filepath传递的,那么只用一行代码就可以完成我们的需求了:count = len(open(filepath,'rU').readlines()) 如果是非常大的文件,上面的方法可能很慢,甚至失效.此时,可以使用循环来处理:count...

2017-06-21 16:21:00 71

转载 python

# coding=utf-8 #append # append是list(列表)的方法,函数参数是可以是任意一个元素,作用是在列表的最后添加上这个新元素。例如a=[1,2,3]则 # a.append(4)以后a就是[1,2,3,4] a = [1,2,3] print a ...

2017-06-21 09:18:00 78

转载 OmicCircos的一些简单的使用心得

对于circos图想必大家并不陌生,但是一般自己安装circos软件着实有点儿麻烦。而在R中的OmicCircos包却能让你很好的解决问题,可以去画一些简单的而又不落俗套的circos图1,首先是下载## try http:// if https:// URLs are not supportedsource("https://bioconductor.org/bio...

2017-06-20 21:28:00 887

转载 sed和awk的一些使用【转载自http://blog.sina.com.cn/s/blog_6561ca8c0102we0o.html】

在linux中,awk和sed命令对于快速的文本编排非常灵活有用。对文本插入列的操作也可以使用sed或者awk命令来处理,下面简单介绍:如果想要在指定列前插入字符串RR,可以使用以下命令:awk '{$NF="RR"$NF; print}'filename这里的$NF可以替换成任意的列数,RR字符串可以替换成任意多列字符串如果想要在指定行的某一列前插入字...

2017-06-20 16:33:00 98

转载 liftover[装载自http://www.cnblogs.com/emanlee/p/5064630.html]

Lift genome positionsGenome positions are best represented inBED format. UCSC provides tools to convert BED file from one genome assembly to another.Binary liftOver toolWe needliftOver bi...

2017-06-20 16:15:00 136

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除