![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
工作记录
文章平均质量分 72
我是大南瓜
个人学习笔记
展开
-
记录---提取合并VCF文件
记录—提取合并VCF文件最近有个需求,需要合并两个VCF集合,两个文件中材料名完全不同,SNP名部分相同,想要合并为相同SNP下不同Sample的一个VCF文件。整体思路是:(1)找到两个VCF文件的共有SNP(2)合并两个VCF文件(SNP相同,Sample列不同)0. 简化GATK结果生成的VCF文件生成的GATK的VCF文件中包含很多信息,文件特别大,想要简化一下,保留基因型信息,剔除不想要的信息:import os,sysinf=sys.argv[1] # input fileo原创 2022-03-03 22:58:50 · 2636 阅读 · 1 评论 -
记录---转录组unigene结果分析(无参考)
转录组unigene表达结果,依据亚细胞定位再分析(无参考RNA-seq)我们有一个几年前无参考转录组分析unigene的表达量结果,该转录组实验有两个处理(0 hour heat 和 6 hour heat treatment),想要从中查看铜相关基因在两个处理下的累积表达量情况,表达量分类是依据预测的亚细胞定位建立的。方便记录,具体操作步骤如下:1. balstx寻找与已知铜蛋白比对率高的unigene序列(1)已知两个文件unigene.fasta (unigene DNA fasta)RN原创 2022-02-27 12:30:25 · 3687 阅读 · 0 评论