python应用
ZHEFXC
这个作者很懒,什么都没留下…
展开
-
[genefuse] 生成genefuse 的fusion.csv文件
最近分析一批panel测序数据,Panel中包含一些针对Fusion的捕获探针,使用delly等call SV的软件效果并不好。所以尝试使用genefuse这个软件。genefuse这个软件是根据一些先验的可能形成Fusion的基因对,直接从fastq文件检测Fusion,我觉得可能会被没有先验知识的caller的性能更好一些。但是,我做的是血液肿瘤,而官方提供的先验Fusion文件中没有包括血...原创 2019-09-19 08:57:16 · 891 阅读 · 0 评论 -
BWT 算法和序列比对的基本实现
昨天晚上和今天抽空实现了Burrows Wheleer Tansform,并且尝试利用BWT,将短序列比对到长序列中。BWT的核心我觉得是要理解两个原则:1. F序列的每个元素是下标对应的L元素的后一位。2. 排序后,F中第一个A和L中第一个A是同一个A。(排序不改变相对位置),公共前缀不改变排序位置。mapping 过程实现的非常基础,只能全序列不对,不能有gap。#!/us...原创 2019-09-28 15:05:04 · 2510 阅读 · 0 评论 -
解析 pumbed的xml
meta分析中需要调研大量文献, pubmed数据库是主要来源,但是pubmed导出的文本文件,可读性非常差,并且考虑到需要对文献进行筛选和标记,xlsx是个很好的选择.下面代码是把xml转化为xlsx#!/usr/bin/env python3'''解析 pubmed 导出的xml文件,并且转换成xlsx格式'''import sysimport xml.et...原创 2019-10-11 15:04:09 · 1195 阅读 · 1 评论