生信与基因组学
生物信息研究员,分享生信编程、算法、统计学、临床检测、分子生物学和基因组学等内容,合作可私信咨询
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
生信技能75 - 获取WGS指定区域/全基因组Call变异以及统计每个位点ATCG碱基数量及占比
获取WGS指定区域/全基因组Call变异以及统计每个位点ATCG碱基数量及占比原创 2025-07-17 10:38:19 · 36 阅读 · 0 评论 -
生信技能74 - WGS插入片段长度分布数据提取与绘图
本文介绍了两种分析基因组测序数据中片段长度分布的方法:单样本模式和多样本合并模式。单样本模式支持使用picard或pysam工具从BAM文件中提取片段长度信息,并绘制插入片段长度分布图;多样本模式则可将指定目录下所有样本的结果进行汇总统计。程序提供了Python实现,包含BAM文件索引、统计信息提取、分布图绘制等功能,支持通过命令行参数指定分析模式、工具选择和输出路径。该工具能有效评估测序文库的片段长度分布特征,为后续生物信息学分析提供质量参考。原创 2025-07-14 13:24:12 · 62 阅读 · 0 评论 -
生信技能73 - 三代测序Nanopore和PacBio-HiFi/CCS原始数据过滤及可视化
三代测序Nanopore和PacBio-HiFi/CCS原始数据过滤及可视化原创 2025-06-24 09:43:42 · 93 阅读 · 0 评论 -
生信技能72 - 三代测序比对+矫正+组装质量评估+覆盖度计算及生成覆盖图
三代测序比对+矫正+组装质量评估+覆盖度计算及生成覆盖图原创 2025-04-11 12:39:28 · 148 阅读 · 0 评论 -
生信技能71 - 获取barcode序列的碱基差异
获取barcode序列的碱基差异原创 2025-04-08 16:35:06 · 74 阅读 · 0 评论 -
生信技能70 - 基于VCF 文件中计算次等位基因频率(MAF)
基于VCF 文件中计算次等位基因频率(MAF)原创 2025-03-19 21:44:30 · 219 阅读 · 0 评论 -
生信技能69 - 使用deepvariant对基因组指定区域Calling SNPs/Indels
使用deepvariant进行对基因组指定区域Calling SNPs/Indels原创 2025-01-06 19:54:15 · 373 阅读 · 0 评论 -
生信技能68 - bcftools annotate注释VCF SNP的RSID编号
bcftools annotate注释VCF SNP的RSID编号原创 2024-12-25 16:45:40 · 342 阅读 · 0 评论 -
生信技能67 - trimmomatic和fastp质控fastq数据封装方法
trimmomatic和fastp质控fastq数据封装方法原创 2024-12-24 09:14:36 · 518 阅读 · 0 评论 -
生信技能66 - bioconvert实现多种生信文件格式的转换
bioconvert实现多种生信文件格式的转换原创 2024-12-19 20:07:29 · 185 阅读 · 0 评论 -
生信技能65 - SRA数据库公共数据自动化下载及SRA批量自动化拆分
SRA数据库公共数据自动化下载及SRA批量自动化拆分原创 2024-12-12 17:22:27 · 587 阅读 · 0 评论 -
生信技能64 - 提取VCF文件全部样本的双等位基因深度
提取VCF文件全部样本的双等位基因深度原创 2024-12-12 11:11:42 · 281 阅读 · 0 评论 -
生信技能63 - 构建gnomAD变异位点的SQLite查询数据库
构建gnomAD变异位点的SQLite查询数据库原创 2024-12-06 21:16:22 · 415 阅读 · 0 评论 -
生信技能62 - 常用机器学习算法的R语言实现
常用机器学习算法的R语言实现原创 2024-11-13 09:41:29 · 579 阅读 · 0 评论 -
生信技能61 - 获取比对后BAM文件的多项基础统计指标
获取比对后BAM文件的多项基础统计指标原创 2024-10-14 21:22:22 · 331 阅读 · 0 评论 -
生信技能60 - 根据外显子测序结果计算大于等于指定测序深度的区域覆盖率
根据外显子测序结果计算指定大于等于指定深度的区域覆盖率原创 2024-10-14 16:52:09 · 163 阅读 · 0 评论 -
生信技能59 - 基于GATK CallingSNP变异检测及注释流程
基于GATK CallingSNP变异检测及注释流程原创 2024-09-23 20:30:10 · 719 阅读 · 0 评论 -
生信技能58 - 多线程运行更快的BWA比对(bwa-mem2)程序
多线程运行更快的BWA比对(bwa-mem2)程序原创 2024-09-04 13:28:53 · 543 阅读 · 0 评论 -
生信技能57 - Samtools获取指定外显子区域depth和提取BAM文件序列
Samtools获取指定外显子区域depth和提取BAM文件序列原创 2024-08-24 07:00:00 · 453 阅读 · 0 评论 -
生信技能56 - 去除重复BAM文件的窗口reads计数方法
去除重复BAM文件的窗口reads计数方法原创 2024-08-14 22:09:25 · 353 阅读 · 0 评论 -
生信技能55 - WisecondorX分析结果过滤和质控
WisecondorX分析结果过滤和质控原创 2024-08-01 21:31:18 · 291 阅读 · 0 评论 -
生信技能54 - WisecondorX多线程并行分析CNV
WisecondorX多线程并行分析CNV原创 2024-07-26 22:16:58 · 354 阅读 · 0 评论 -
生信技能53 - WisecondorX自动化批量npz转换和reference构建
wiseconrdoX分析CNV适用于CNVseq、NIPT和WGS等项目。原创 2024-07-26 15:58:43 · 229 阅读 · 0 评论 -
生信技能52 - VCF文件hg38与hg19坐标相互转换
对SNP/INDEEL Calling获得的VCF文件进行hg38与hg19的坐标相互转换原创 2024-07-11 13:16:10 · 620 阅读 · 0 评论 -
生信技能51 - 基于BAM文件的微生物污染分析流程
提取未比对到人类参考基因组的bam文件,将其比对到微生物参考基因组,根据比对情况查看是否存在污染原创 2024-07-09 19:52:31 · 260 阅读 · 0 评论 -
生信技能50 - 本地构建Clinvar数据库VCF变异位点快速搜索功能
本地构建Clinvar数据库VCF变异位点快速搜索功能原创 2024-06-28 11:59:28 · 418 阅读 · 0 评论 -
生信技能49 - 获取CNV染色体开始至结束区带长度和全部区带列表
获取CNV染色体开始至结束区带长度和全部区带列表原创 2024-06-26 17:14:34 · 293 阅读 · 0 评论 -
生信技能48 - 如何获取基因的SNP及RefSeq参考序列命名规则
基因的SNP及RefSeq参考序列命名规则原创 2024-06-16 16:31:30 · 710 阅读 · 0 评论 -
生信技能47 - Shell程序和R程序并行执行处理方法
Linux shell和R程序并行化执行程序方法。原创 2024-06-12 11:49:18 · 190 阅读 · 0 评论 -
生信技能46 - Call人类线粒体变异和提取chrM变异位点
使用bwa将样本fastq文件比对到线粒体参考基因组, 并使用bcftools进行call变异。原创 2024-05-25 20:51:58 · 288 阅读 · 0 评论 -
生信技能45 - 基于docker容器运行生信软件
生信软件的docker运行原创 2024-05-07 11:09:17 · 526 阅读 · 0 评论 -
生信技能44 - 西湖(中国)生物样本库汉人数据下载和等位基因频率过滤VCF
Westlake BioBank for Chinese (WBBC) 西湖(中国)生物样本库数据下载及过滤原创 2024-04-19 11:41:57 · 394 阅读 · 0 评论 -
生信技能43 - 基于BAM文件性染色体的样本性别判断
对于高通量测序数据,包括WGS和WES,根据bam文件里面的chrX和chrY的reas比例可以判断性别。原创 2024-03-25 14:09:26 · 444 阅读 · 0 评论 -
生信技能42 - Linux服务器CPU、内存、负载及高消耗进程监控信息写入本地日志
可通过设置最大检测时间(小时)max_hour和循环检测休眠时间(秒)sleep_second调整监控程序的运行时间。原创 2024-03-08 15:20:51 · 171 阅读 · 0 评论 -
生信技能41 - Matplotlib绘制测序Fastq数据ATCG碱基分布图
【代码】绘生信技能41 - Matplotlib绘制测序Fastq数据ATCG碱基分布图。原创 2024-03-07 21:09:11 · 334 阅读 · 0 评论 -
生信技能40 - Clinvar数据库VCF文件下载和关键信息提取
【代码】生信技能40 - Clinvar数据库VCF文件下载和关键信息提取。原创 2024-03-04 16:13:00 · 528 阅读 · 0 评论 -
生信技能39 - 通过UCSC单条染色体Fasta序列构建hg38参考序列及其索引
通过UCSC单条染色体Fasta序列构建hg19参考序列及其索引原创 2024-01-26 21:20:58 · 374 阅读 · 0 评论 -
生信技能38 - 根据染色体编号和CNV起始位置进行CNV注释程序封装
通过对ClassifyCNV CNV注释工具进行封装,只输入染色体编号+CNV起始位置+CNV结束位置,即可对该区域进行注释,并对结果进行格式化输出,保留原结果主要信息,精简结果文件。生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV。原创 2024-01-24 14:57:27 · 279 阅读 · 0 评论 -
生信技能37 - ClinGen数据库获取单倍剂量不足和三倍剂量敏感基因
可进行Gene-Disease Validity Curations 、Dosage Sensitivity、Clinical Actionability和Variant Pathogenicity相关数据下载,支持人类hg19/hg38版本文件下载,本文涉及剂量敏感剂量属于Dosage Sensitivity downloads的下载内容。文件名称getDosageSensitivityGenes.py。本人选择剂量基因描述为证据充分的剂量基因(红色)。windows系统直接点击按钮下载即可。原创 2024-01-17 12:07:00 · 777 阅读 · 0 评论 -
生信技能36 - 获取染色体短臂、长臂和跨短臂长臂的全部区带列表
如何获取CNV开始位置和结束位置所在的染色体区带,可以参考以下本人文章,本程序涉及的cytoBand.txt与上述文章中cytoBand.txt一致。原创 2024-01-16 21:00:58 · 371 阅读 · 0 评论