![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
bioinfo
文章平均质量分 87
青灯照颦微
这个作者很懒,什么都没留下…
展开
-
【bioinfo】收藏生信常用网址
sam flag值对应信息: https://broadinstitute.github.io/picard/explain-flags.html。samtools构建的索引.fai文件格式:https://www.htslib.org/doc/faidx.html。使用NCBI-blat进行序列比对:http://genome.ucsc.edu/cgi-bin/hgBlat。samtools使用:http://www.htslib.org/doc/samtools.html。基因组组装、注释和可视化。原创 2024-01-24 19:07:20 · 960 阅读 · 0 评论 -
【python】从Ensembl上,根据Array HumanMethylation450甲基化探针cg编号(比如cg13788592)获取位置
一篇专利1中提到多种癌种及对应的特异性CpG位点,想获取对应cg位点具体的位置或序列。专利中的一组CpG markers如下:需求就是:将这些cg编号作为文件输入,获取对应的序列和位置信息。原创 2023-07-14 17:42:14 · 1098 阅读 · 0 评论 -
【python】数据预处理:分位数归一化 Quantile Normalization + INSCODE AI创作助手测试
这里主要了解一下分位数归一化(。如无特殊说明时,本文中的QN作为分位数归一化的缩写。Quantile Normalization 直接翻译是 分位数归一化,但也有翻译为分位数标准化。笔者理解是按直译叫分位数归一化,但是按数据的处理方式,应该叫分位数标准化,按英文的话就一种:Quantile Normalization。之所以有标准化和归一化两种说法,是因为它们是两种不同的处理方式。本文暂统一名称叫分位数归一化(QN)。原创 2023-05-31 16:57:43 · 5508 阅读 · 0 评论 -
【bioinfo】二代测序在肿瘤突变检测中的错误来源和解决策略
文献介绍了NGS检测工作流程中的错误来源,以及非NGS检测方法介绍及其优缺点。具体包括:1)序列伪影(artifacts,假象/错误的/人为加工过的)产生的来源组织和DNA处理:FFPE/福尔马林固定、DNA超声波打断NGS处理过程:PCR扩增、测序错误随机低水平的假基因突变(NGS常规流程无法识别)妥协的NGS下限(LOD)(NGS的下限LOD受到限制)实时多特异PCR;ddPCR:微滴数字PCR;BEAMing:数字PCR流式技术(ddPCR的简易版);3)非NGS的优缺点。原创 2023-03-24 15:35:22 · 1003 阅读 · 1 评论 -
【bioinfo】融合检测软件FusionMap分析流程和报告结果
下面主要内容是关于RNA-seq数据分析融合,用到软件是FusionMapFusionMap参考文献融合分析使用哪个软件,哪个软件表现较好,在Biostarts发现一个问答列举了一些软件(看这里),里面有STAR-Fusion, STAR-Fusion, deFuse, FusionCatcher等30多个融合分析软件,其中约20多个软件的文献发表于2011-2013年,FusionMap软件的文献也发表与2011年。原创 2023-03-09 09:26:11 · 948 阅读 · 0 评论 -
【bioinfo】酶切法片段化建库相比超声打断建库引入softclip使用FADE软件识别/去除
文献提供的酶切产生的错误识别和去除软件。linux版FADE软件下载、使用原创 2023-01-06 20:26:14 · 997 阅读 · 0 评论 -
【bioinfo】根据sam文件中的MD标签判断reads比对情况
MD标签是值:比对上的相对位置信息和错误信息。根据MD标签判断read的比对情况。原创 2022-10-20 15:28:34 · 585 阅读 · 0 评论 -
【python】两个bed文件取交集
这里写的python脚本纯属造轮子,而且运行速度很慢,还需要改进。分别是:bed交集,bed1独有的位点,bed2独有的位点。执行后,outdir目录下有3个文件。原创 2022-10-19 09:18:10 · 1030 阅读 · 2 评论 -
【bioinfo】hisat2/bowtie2比对结果summary文件解读
hisat2/bowtie2比对后,比对结果基本信息统计的summary文件解读。原创 2022-10-17 15:11:38 · 1689 阅读 · 0 评论 -
【bioinfo】fasta/fastq/sam格式互相转化
使用awk转化:fq2fa:awk '{if((NR+3)%4==0)printf ">"$1;if((NR+2)%4==0)print "\n"$1}' ${fq} > ${fa}samtools fastqsamtools fastq -n ${sam} > ${fq}-n: 输出不标记"/1"或 “/2”, Read1、Read2的标记原创 2022-10-14 14:42:57 · 6071 阅读 · 0 评论 -
【bioinfo】bedtools之intersect命令参数
bedtools intersect参数,对两个基因组位置信息文件取交集原创 2022-08-26 14:48:39 · 4858 阅读 · 0 评论 -
【python】使用pysam读取sam/vcf/fasta文件时的常用属性
判定该记录序列信息是read1或read2,是否是反向比对?判定该记录序列信息是否未比对上?配对序列是否反向比对?配对序列是否未比对上?读取sam文件时,熟悉一些常用的属性。如何将读取的信息转换成字符?............原创 2022-08-04 18:41:51 · 6856 阅读 · 3 评论 -
【bioinfo】sam文件可选区域字段(Optional Feild)含义
SAM文件可选字段说明上面两个链接是关于sam文件格式的官方说明文档,第一个包含所有字段,但对可选字段的说明比较简略,第二个是对可选字段的详细说明。这里根据官方文档,说明一下可选字段的具体含义。下面是sam文件的示例,其中第12列及以之后(红色框)就是可选字段:可选字段说明可选字段的构成格式: TAG:TYPE:VALUE,例如,上面sam文件示例,可选............原创 2022-08-04 17:05:54 · 957 阅读 · 1 评论 -
【bioinfo】samtools stats 输出结果解读
参考:samtools stats# sam or bam input$ samtools stat test.sam > test_sam_stat.txt原创 2022-07-15 19:00:00 · 4216 阅读 · 1 评论 -
【bioinfo】bbtools:bbmerge 二代测序reads合并工具了解
bbtools:官网使用说明参考文献bbmerge$ {software_path}/bbmap/bbmerge.shWritten by Brian Bushnell and Jonathan RoodLast modified June 26, 2019Description: Merges paired reads into single reads by overlap detection.With sufficient coverage, can merge nonoverl原创 2022-07-13 17:55:12 · 2133 阅读 · 0 评论 -
【bioinfo】了解IGH基因和IGH基因重排
IGH基因重排原创 2022-07-11 18:51:27 · 9681 阅读 · 0 评论 -
【bioinfo】bwa mem 比对分值参数测试
测试bwaBWA mem -M -k10 -T10 ./ref/ref.fa tst1.fq > tst1.sammem命令比对:比对分值阈值默认是[30],即read比对得分值>=30,输出比对结果。参数默认比对情况分值说明-A[1]Match11bp比对得1分-B[4]Mismatch-41bp错配扣4分-O[6,6]gap(ins,del)-6,-61bp的ins扣6分,del扣6分-E[1]gap e原创 2021-06-08 20:59:44 · 7112 阅读 · 1 评论 -
使用seqtk截取fastq数据
0. 写在前面这是GitHub地址: https://github.com/lh3/seqtkseqtk是针对fastq/fasta格式数据的处理工具,随机获取fastq数据(sample)只是seqtk的一个功能。还有一个是根据输入的bed文件或者reads的名称列表(name list)文件,获取子序列(subseq)。seqtk也包含了数据质控的一些功能,比如,去低质量reads(tr...原创 2019-08-13 11:29:22 · 11317 阅读 · 0 评论 -
质控软件fastp常用参数说明
1)fastp介绍fastp文献fastp下载fastq文件处理工具,基于C2)功能多线程去接头碱基矫正根据滑动窗口质量值剪切切ployG/ployX尾巴处理分子标签(UMI)分割输出结果duplicate率的评估过表达序列分析质控结果报告...原创 2019-07-04 18:18:17 · 29228 阅读 · 6 评论 -
mark几款质控软件fastp, trimmomatic, SOAPnuke
Fastp参考文献githubTrimmomatic参考文献官方网站使用手册SOAPnuke参考文献github一些介绍比较详细的文章:NGS 数据过滤之 Trimmomatic 详细说明 这篇文章介绍Trimmomatic软件说明参数比较详细生信工具Fastp的安装及其在二代测序数据过滤质控中的使用说明 这篇介绍了fastp的安装和使用说明Trimmo...原创 2019-06-21 18:33:16 · 3454 阅读 · 0 评论