自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 用Hifiasm组装基因组:(三)Hifiasm软件组装基因组的多种模式

该算法结合了HiFi数据中精确的局部单倍型信息和Hi-C数据中的长距离互作用信息以达到全局定相 (phasing),从而获得不依赖亲本信息的染色体级别的单倍型组装结果。单倍体分型组装生成一对文件(asm.bp.hap1.p_ctg.gfa和asm.bp.hap2.p_ctg.gfa),代表二倍体的两个单倍型。根据可用的数据不同,Hifiasm组装基因组在HiFi数据基础上,还有几种模式可以增加组装的完整度和准确度。Hi-C Integrated assembly 模式(HiFi数据+Hi-C数据)

2024-06-22 10:59:52 1075

原创 用Hifiasm组装基因组:(二)Hifiasm软件的算法

在标准的trio-binning策略中,无法区分的杂合reads在两个亲本数据集中都会使用。与现有基于Hi-C组装单倍体基因组的方法不同,Hifiasm(Hi-C)算法直接在 HiFi 组装图上运行,并将 Hi-C read mapping、分型(phasing)和组装紧密集成到一个单一的可执行程序中,而不依赖外部工具。Hifiasm(trio)算法在亲本 k-mers 的unitigs中标记reads,但 Hifiasm(Hi-C)用 Hi-C reads对相对较短的unitigs进行分类。

2024-06-21 17:37:47 896 2

原创 用Hifiasm组装基因组:(四)用Hifiasm软件组装基因组的操作

要检查Ho_coverage值是否接近k-mer plot中确定的纯和峰值Ho_peak值,如果不接近(比如更接近He_peak值)那表明hifiasm错误地确定了纯合子覆盖度值,此时组装的基因组要么太大,要么太小。log文件会先打印一个k-mer plot,如果指定了Hi-C数据,还会再接着打印几轮校正(round 1,2,3,finally)的k-mer plot。对于输出的每个图(graph),Hifiasm也会输出一个简化版本(xx_nnoseq_xx.gfa),这个版本没有易于可视化的序列。

2024-06-21 11:02:18 1198

原创 用Hifiasm基于HiFi数据组装基因组:(一)简介Hifiasm软件和HiFi数据

HiFi reads(High Fidelity reads)是2019年由PacBio公司推出的基于环化一致性序列(Circular Consensus Sequencing,CCS)模式产生的既兼顾长读长(10-20kb的长度)又具有高精度(>99%准确率)的测序结果。宏基因组组装评估中,hifiasm-meta以及metaflye的组装错误最少,但是在面对复杂宏基因组时hifiasm-meta的完整性及连续性明显优于metaflye,但同时也会保留部分冗余的序列。半天时间可以组装一个人类基因组。

2024-06-21 11:01:35 755

原创 富集分析:(一)概述

介绍了富集分析和分析软件,包括在线富集分析工具KOBAS-i和GOEAST,富集分析R包topGO,clusterProfiler。

2022-06-26 16:31:54 9610

原创 用k-mer分析进行基因组调查:(六)用KmerGenie一步实现

介绍KmerGenie,用KmerGenie做基因组调查(genome survey)的k-mer频数统计和基因组特征评估。

2022-06-19 23:09:43 2692 1

原创 用k-mer分析进行基因组调查:(五)用GCE分步实现

介绍GCE,用GCE的kmerfreq做基因组调查(genome survey)的k-mer频数统计,GCE的gce做基因组特征评估。

2022-06-18 00:27:00 1029

原创 用k-mer分析进行基因组调查:(四)用GenomeScope评估基因组特征

介绍GenomeScope,用GenomeScope做基因组调查(genome survey)的基因组特征评估。用GenomeScope1.0评估二倍体物种的基因组大小、杂合度、重复率等基因组特征,用GenomeScope2.0评估多倍体物种的基因组大小、杂合度、重复率、基因型比例和基因组结构(同源/异源多倍体)等基因组特征,用Smudgeplot估计物种的倍性。...

2022-06-16 22:05:06 1595 1

原创 用k-mer分析进行基因组调查(genome survey):(三)用KMC进行k-mer频数统计

介绍KMC,用KMC做基因组调查(genome survey)的k-mer频数统计。

2022-06-15 23:42:35 1451

原创 用k-mer分析进行基因组调查:(二)用jellyfish进行k-mer频数统计

介绍jellyfish,用jellyfish做基因组调查(genome survey)的k-mer频数统计。

2022-06-14 22:49:07 1789

原创 用k-mer分析进行基因组调查:(一)基本原理

基因组调查(genome survey)指基因组特征评估,一般指通过k-mer分析二代测序数据,获得基因组大小(genome size),杂合度(heterozygosity),重复序列比例,GC含量等基因组信息的手段。

2022-06-14 22:01:52 4505

原创 【无标题】

关于生信技工

2022-06-14 21:59:59 75

原创 #step by step# Linux command line and explanation for NGS data

参考http://userweb.eng.gla.ac.uk/umer.ijaz/bioinformatics/linux.htmlhttp://blog.csdn.net/lixiangyong123/article/details/52062323http://blog.csdn.net/lixiangyong123/article/details/51816747http

2017-12-04 18:12:19 442

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除