格式转换
文章平均质量分 58
学生信的大叔
生信分析工程师
展开
-
利用linux中awk从gtf文件中提取外显子的bed文件
0 为第1个碱基,100表示第101个碱基,但是不包含第101个碱基,因此这个写法表示位置1到100。其中,feature起始与结束为左闭右开区间,即表示第1到第100个碱基可以理解为数学上的区间。由于bed文件起始位置要从0开始,与gtf文件不同,所以在打印时起始位点要减去1,即。即为将基因ID,转录本ID和exon number拼接在了一起,以保留更多内容。这里将基因ID ,转录本ID和exon编号做一些处理,在后续。利用awk从gtf文件中提取exon的bed文件。这里时可以直接进行减法运算的。原创 2024-06-03 00:23:54 · 80 阅读 · 0 评论 -
利用linux中sed给染色体编号加前缀chr
在做生信分析的时候,很多情况下我个人倾向于从ENSEMBL下载基因组,但是这个数据库的染色体编号为数字,而一些f分析软件会要求chr前缀。这里演示下如何进行给gtf文件和基因组添加chr前缀。查看gtf染色体前缀。查看基因组染色体前缀。原创 2024-06-03 00:15:34 · 45 阅读 · 0 评论 -
linux 图像格式转换: pdf转png格式
试了下R将pdf矢量图转换为png位图,不如linux下convert方便好用。原创 2024-02-15 09:30:59 · 424 阅读 · 0 评论 -
测序数据sff文件转为fastq数据工具:sff2fastq和sff_extract
记录下两个将测序数据从sff格式转为fastq格式的工具`sff2fastq`和`sff_extract`原创 2023-10-04 21:13:25 · 168 阅读 · 0 评论