在 Oxford Nanopore MinION 和 GridION 上对人类转录组进行直接 RNA 和 cDNA 测序
引言
我们使用直接 RNA 测序试剂盒(30 个流动池)在 Oxford Nanopore MinION 上对 CEPH1463(NA12878/GM12878,Ceph/Utah 谱系)人类基因组参考标准进行了测序,并使用 1D 连接试剂盒(SQK-LSK108)在 R9.4 流动池上使用 R9.4 化学试剂(FLO-MIN106)进行了测序。从培养的细胞系中提取了来自 GM12878 人类细胞系(Ceph/Utah 谱系)的 RNA。
数据重用和许可证
我们鼓励您在您自己的分析和出版物中重用这些数据,这些数据在 Creative Commons CC-BY 许可证下发布。因此,如果您这样做,我们希望您能引用下面的参考文献。
引用
Rachael E. Workman, Alison D. Tang, Paul S. Tang, Miten Jain, John R. Tyson, Roham Razaghi, Philip C. Zuzarte, Timothy Gilpatrick, Alexander Payne, Joshua Quick, Norah Sadowski, Nadine Holmes, Jaqueline Goes de Jesus, Karen L. Jones, Cameron M. Soulette, Terrance P. Snutch, Nicholas Loman, Benedict Paten, Matthew Loose, Jared T. Simpson, Hugh E. Olsen, Angela N. Brooks, Mark Akeson & Winston Timp. Nanopore native RNA sequencing of a human poly(A) transcriptome. Nature Methods doi: doi:10.1038/s41592-019-0617-2
rel2 [已修复] [2020年12月更新] 基序识别(Guppy 4.2.2)
完整的原生 RNA 数据集(30 次运行)、完整的 cDNA 数据集(12 次运行)和 IVT RNA 数据集。使用 Guppy 4.2.2 翻转(hac)模型对数据进行了重新基序识别。
文件类型 | 运行次数 | 链接 |
---|---|---|
原生 RNA | 30 | FASTQ, 摘要文件 (gzip), Multi_FAST5 |
cDNA | 12 | FASTQ, 摘要文件 (gzip), Multi_FAST5 |
IVT RNA | 2 | FASTQ, 摘要文件 (gzip), Multi_FAST5 |
贡献者
- Nick Loman, Josh Quick, Andrew Beggs, Jaqueline Goes de Jesus (伯明翰大学)
- Matt Loose, Nadine Holmes, Matthew Carlile (诺丁汉大学)
- Winston Timp, Roham Razaghi, Timothy Gilpatrick, Norah Sadowski, Rachael E. Workman (JHU)
- Jared Simpson, Phil Zuzarte, Paul Tang (OICR)
- Terry Snutch, John Tyson (UBC)
- Mark Akeson, Angela N. Brooks, Hugh E. Olsen, Benedict Paten, Alison Tang, Miten Jain (UCSC)
基序识别 (Albacore 2.1)
完整的原生 RNA 数据集(30 次运行)和完整的 cDNA 数据集(12 次运行)。
文件类型 | 运行次数 | 读取次数 | 平均长度 (b) | 读取 N50 (b) | 链接 |
---|---|---|---|---|---|
原生 RNA 通过 | 30 | 10302647 | 1030.24 | 1334 | FASTQ |
原生 RNA 失败 | 30 | 2686736 | 430.96 | 840 | FASTQ |
cDNA 通过 | 12 | 15152101 | 932.86 | 1072 | FASTQ |
cDNA 失败 | 12 | 9129338 | 661.90 | 841 | FASTQ |
综合 Albacore 摘要
FASTQ (序列数据)、FAST5 (原始信号数据) 和 Bulk FAST5 (连续数据)
可以在 这里 找到按中心和样本分割的数据集的 FASTQ 和 FAST5 文件。连续的 Bulk FAST5 文件可以使用 bulkvis 进行可视化。
对齐文件
所有对齐都是使用 minimap2 执行的。
FileType | Reference | Params | BAM | BAI |
---|---|---|---|---|
Native RNA Pass | GRCh38_full_analysis_set_plus_decoy_hla.fa | -ax splice -uf -k14 | hg38 BAM | hg38 BAI |
Native RNA Pass | SIRVome_isoforms_ERCCs_170612a.fasta | -ax splice --splice-flank=no | SIRVome BAM | SIRVome BAI |
Native RNA Fail | GRCh38_full_analysis_set_plus_decoy_hla.fa | -ax splice -uf -k14 | hg38 BAM | hg38 BAI |
Native RNA Fail | SIRVome_isoforms_ERCCs_170612a.fasta | -ax splice --splice-flank=no | SIRVome BAM | SIRVome BAI |
cDNA Pass | GRCh38_full_analysis_set_plus_decoy_hla.fa | -ax splice -uf -k14 | hg38 BAM | hg38 BAI |
cDNA Pass | SIRVome_isoforms_ERCCs_170612a.fasta | -ax splice --splice-flank=no | SIRVome BAM | SIRVome BAI |
cDNA Fail | GRCh38_full_analysis_set_plus_decoy_hla.fa | -ax splice -uf -k14 | hg38 BAM | hg38 BAI |
cDNA Fail | SIRVome_isoforms_ERCCs_170612a.fasta | -ax splice --splice-flank=no | SIRVome BAM | SIRVome BAI |
## 分析
联盟工作的各种分析和相关文件可以在 [这里](nanopore-human-transcriptome/phase1_analyses.md) 找到。
## 参考文件
用于分析的参考文件的详细信息和下载链接可以在 [这里](nanopore-human-transcriptome/reference.md) 找到。
## 外部链接
Heng Li 已经为 UCSC 基因组浏览器制作了一个 [定制轨迹](https://genome.ucsc.edu/cgi-bin/hgTracks?db=hg38&position=chr6:43,767,094-43,788,458&hgct_customText=track%20type%3DbigBed%20name%3DNA12878-DirectRNA.minimap2-2.5%20useScore%3D1%20visibility%3D4%20itemRgb%3D%22On%22%20bigDataUrl%3Dhttps%3A%2F%2Ffiles.osf.io%2Fv1%2Fresources%2Fb5nm2%2Fproviders%2Fosfstorage%2F5a2347599ad5a10272ed5739%3Faction%3Ddownload%26version%3D1%26direct%3D1) 来自直接 RNA 数据集。谢谢 Heng! [1]
## 参考文献
[1] Li, H 推特 [链接](https://twitter.com/lh3lh3/status/937166309414064129)
## 致谢
我们非常感谢 Daniel Garalde, Daniel Jachimowicz, Andy Heron, Rosemary Dokos 在 Oxford Nanopore Technologies 为提供技术和后勤支持。我们感谢 Angel Pizarro 和 Jed Sundwall 在 Amazon Web Services 上托管这个数据集作为 AWS 开放数据集。
---
文档中包含了对人类转录组进行直接 RNA 和 cDNA 测序的介绍、数据重用和许可证信息、引用、贡献者、基序识别、对齐文件、分析、参考文件、外部链接以及致谢。此外,还提供了相关数据集的下载链接和分析工具的链接。