自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 解析 pumbed的xml

meta分析中需要调研大量文献, pubmed数据库是主要来源,但是pubmed导出的文本文件,可读性非常差,并且考虑到需要对文献进行筛选和标记,xlsx是个很好的选择.下面代码是把xml转化为xlsx#!/usr/bin/env python3'''解析 pubmed 导出的xml文件,并且转换成xlsx格式'''import sysimport xml.et...

2019-10-11 15:04:09 1229 1

原创 BWT 算法和序列比对的基本实现

昨天晚上和今天抽空实现了Burrows Wheleer Tansform,并且尝试利用BWT,将短序列比对到长序列中。BWT的核心我觉得是要理解两个原则:1. F序列的每个元素是下标对应的L元素的后一位。2. 排序后,F中第一个A和L中第一个A是同一个A。(排序不改变相对位置),公共前缀不改变排序位置。mapping 过程实现的非常基础,只能全序列不对,不能有gap。#!/us...

2019-09-28 15:05:04 2550

原创 tidyverse 常见错误处理

1) spread()Error: Each row of output must be identified by a unique combination of keys.遇到上述错误的时候,原因是错误的指定了参数。spread()函数有三个主要参数,key,value,fillkey指的是变成宽数据之后的成为列名的列value指的是填充的列fill指的是当value没有填...

2019-09-25 22:08:55 4609

原创 R 常见错误和处理方法

安装R包报错:1)grab failed: window not viewable.Error in structure(.External(.C_dotTclObjv, objv), class = "tclObj") :[tcl] grab failed: window not viewable.一般发生在远程linux系统中安装R包,是因为R调用窗口失败,解决方法是 ...

2019-09-25 16:34:16 4992

原创 [转载] 使用rsync 替代scp 实现断点续传

使用rsync 作为scp 的替代实现断点续传主机A传送文件夹TestDB到主机Brsync -rP--rsh=ssh /home/oracle/TestDB/ oracle@192.168.1.173:/home/oracle/TestDB[oracle@rac1-server TestDB]$ rsync -rP --rsh=ssh /home/oracle/TestD...

2019-09-19 17:14:17 691

原创 Git 使用以及常见问题处理

Git 使用:基本概念[此图源于互联网][此图源于互联网]使用Git之前需要有几个基本概念三棵树, 也就是根据时间线串起来的三个标签区.history是我们保存一个完整的一些列修改的地方,可以认为是最终的仓库. index 暂存区, workspace 实际工作路径一个关键的操作:我的理解, 工作区中的文件如果不add(添加到index) 或者com...

2019-09-19 16:50:22 894

原创 使用preseq计算文库复杂度以及估计加测量

在评估下机数据的时候,如果发现数据去重复之后无法达到目标覆盖度,那么就需要进一步加测。然而,有些文库复杂度很低,即使加测很多数据也无法得到更多的有效信息。那么如何评估文库复杂度,判断是否有加测的必要呢?使用preseq软件可以实现根据现有测序数据评估已测序数据的复杂度,以及整个文库的复杂度。其中子命令c_curve可以方便的计算现有测序数据中总测序量(total reads)与 有效数据量(...

2019-09-19 09:04:14 1334

原创 [genefuse] 生成genefuse 的fusion.csv文件

最近分析一批panel测序数据,Panel中包含一些针对Fusion的捕获探针,使用delly等call SV的软件效果并不好。所以尝试使用genefuse这个软件。genefuse这个软件是根据一些先验的可能形成Fusion的基因对,直接从fastq文件检测Fusion,我觉得可能会被没有先验知识的caller的性能更好一些。但是,我做的是血液肿瘤,而官方提供的先验Fusion文件中没有包括血...

2019-09-19 08:57:16 905

转载 ld 动态链接库配置

一、ldconfigldconfig是一个动态链接库管理命令,为了让动态链接库为系统所共享,还需运行动态链接库的管理命令--ldconfig。 ldconfig 命令的用途,主要是在默认搜寻目录(/lib和/usr/lib)以及动态库配置文件/etc/ld.so.conf内所列的目录下,搜索出可共享的动态 链接库(格式如前介绍,lib*.so*),进而创建出动态装入程序(ld.so)所

2016-12-05 11:56:07 2968

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除