使用picard评估文库复杂度

最新推荐文章于 2024-05-16 09:43:51 发布

生信修炼手册

最新推荐文章于 2024-05-16 09:43:51 发布

阅读量1.9k

点赞数 2

文章标签：数据分析编程语言 wireshark css 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43569478/article/details/108079898

版权

欢迎关注”生信修炼手册”!

文库复杂度对应的英文如下

Library Complexity

表示的是文库中unique的分子数目，unique分子数目越多，文库复杂度越高。在数据分析中，重复序列会对下游分析造成影响，在snp calling, peak caling等分析前都需要去除文库中的重复序列。

只有一个复杂度高的文库，才能确保挖掘出更多有效的信息，所以在数据分析中，需要对文库的复杂度进行评估。本文主要介绍下通过picard这个工具来评估文库复杂度，用法如下

java -jar picard.jar \
EstimateLibraryComplexity \
I=input.bam \
O=lib_complex_metrics.txt

基本用法非常简单，只需要指定输入输出即可，输入文件为比对产生的bam文件，输出文件记录了文库复杂度信息，其内容如下

为了方便展示，这里我截取了部分重点内容并进行了转置，其中有3个指标识别需要重点关注

READ_PAIRS_EXAMINED, bam文件中包含的序列数，这里以fragment为单位，默认会根据MAPQ值对bam文件中的reads进行过滤，这里统计的是过滤之后的序列数
READ_PAIR_DUPLICATES，bam文件中包含的重复序列数
ESTIMATED_LIBRARY_SIZE, 预测出来的文库中unique分子的数目

通过序列数和重复序列数，有对应的公式来计算unique分子数目，公式如下

其中N表示bam文件中的序列数，C表示bam文件中的unique序列数，用序列数减去重复序列数即可得到，N就是文库中unique分子数目，即library size。

·end·

—如果喜欢，快分享给你的朋友们吧—

原创不易，欢迎收藏，点赞，转发！生信知识浩瀚如海，在生信学习的道路上，让我们一起并肩作战！

本公众号深耕耘生信领域多年，具有丰富的数据分析经验，致力于提供真正有价值的数据分析服务，擅长个性化分析，欢迎有需要的老师和同学前来咨询。

更多精彩

写在最后

转发本文至朋友圈，后台私信截图即可加入生信交流群，和小伙伴一起学习交流。

扫描下方二维码，关注我们，解锁更多精彩内容！

一个只分享干货的

生信公众号

生信修炼手册

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用picard评估文库复杂度

欢迎关注”生信修炼手册”!文库复杂度对应的英文如下Library Complexity表示的是文库中unique的分子数目，unique分子数目越多，文库复杂度越高。在数据分析中，重复序...
复制链接

扫一扫

生信修炼手册 CSDN认证博客专家 CSDN认证企业博客

码龄6年

884: 原创

3万+: 周排名

117万+: 总排名

300万+: 访问

: 等级

1万+: 积分

3985: 粉丝

1520: 获赞

337: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

TCGA 1篇
转录组 27篇
circos 24篇

最新评论

SnpSift学习笔记(三)
2401_83157985: 您好!请问一下3、tstv中 tstv命令用于计算突变位点中，转换和颠换的比例，用法中的hom是什么意思呀期待您的回复
使用muscle进行多序列比对
afica166: muscle5.1: muscle -align input.fa -output aln.afa
校准曲线的绘制的小技巧
happyruth: 你好！请问虽然m指定了样本分组个数，但是重抽样后只出现了一个点的数值怎么办啊？（就是只有一个组的KM列和std.err列）
ConsensusClusterPlus，一步到位的一致性聚类！
yyyyyooolll: 请问tpm数据还需要进行归一化操作吗
使用ChIPseeker进行peak注释
m0_70501154: Error in tagHeatmap(tagMatrix, xlim = c(-3000, 3000)) : unused argument (xlim = c(-3000, 3000)) 报这个错是什么原因呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。