本文框架
前言
最近在复现生信的论文代码,作为一个门外汉,在找数据这里就遇到了困难。就拿STAGATE这篇的一个数据集DLPFC数据来说,在官网找了好久都没有找到h5ad格式的数据。后面在github逛的时候偶然看到一个仓库也用这个数据来做paper,所以就先拿来用了。
数据获取(DLPFC)
STAGATE用了很多数据集,如DLPFC等,原文给的链接是这样的:
作者写道,DLPFC数据可以从下面网址获取。但是,即使我挂了梯子还是无法正常打开网页。。。
http:// spatial.libd.org/spatialLIBD
如果你顺藤摸瓜继续找下去,大概率会找到spatialLIBD的github网页,然后你会发现,仓库里只有t值的数据,没有DLPFC数据。。
如果你继续往下找,可能会找到bioconductor网址里的一大堆说明文档,然后被各种类型的DLPFC数据搞花眼。对于新手而言难度还是有点大了。而且不知道为什么,我每次在R上从bioconductor下载数据,一定会报错。例如运行下面的R代码:
spatialLIBD::fetch_data(type = "spatialDLPFC_Visium")
每次都会出现报错:
snapshotDate(): 2024-04-29
adding rname 'https://www.dropbox.com/s/y2ifv5v8g68papf/spe_filtered_final_with_clusters_and_deconvolution_results.rds?dl=1'
Error in BiocFileCache::bfcrpath(bfc, url) :
not all 'rnames' found or unique.
In addition: Warning messages:
1: download failed
web resource path: ‘https://www.dropbox.com/s/y2ifv5v8g68papf/spe_filtered_final_with_clusters_and_deconvolution_results.rds?dl=1’
local file path: ‘/Users/lee/Library/Caches/org.R-project.R/R/BiocFileCache/574451c8bae2_spe_filtered_final_with_clusters_and_deconvolution_results.rds%3Fdl%3D1’
reason: Timeout was reached: [www.dropbox.com] Failed to connect to www.dropbox.com port 443 after 10003 ms: Timeout was reached
2: bfcadd() failed; resource removed
rid: BFC18
fpath: ‘https://www.dropbox.com/s/y2ifv5v8g68papf/spe_filtered_final_with_clusters_and_deconvolution_results.rds?dl=1’
reason: download failed
3: In value[[3L]](cond) :
trying to add rname 'https://www.dropbox.com/s/y2ifv5v8g68papf/spe_filtered_final_with_clusters_and_deconvolution_results.rds?dl=1' produced error:
bfcadd() failed; see warnings()
如果顺着他给的网址下载,确实是可以下载到相应的Rdata格式数据。
但是!!!!!!
STAGATE的tutorial用的是h5ad格式的数据啊!!(不过spatialLIBD确实提供了函数可以转换两类数据,我没实验,大家可以try一下)
所以我就在想可以在哪里直接找到DLPFC的h5ad格式数据。
然后回忆起之前逛github的时候,有一个叫STAIG的仓库,里面用的就是DLPFC数据。仓库链接挂这里:
https://github.com/y-itao/STAIG
数据可以从谷歌网盘下载:
https://drive.google.com/file/d/1XfBSPM-Dg-Cl3T1PTgMZqXM9jNWuqMQF/view
费尽千辛万苦终于找到数据。如果自己的paper里要使用DLPFC数据,记得正确引用。
paper链接
STAGATE:
https://www.nature.com/articles/s41467-022-29439-6
STAIG:
https://www.biorxiv.org/content/10.1101/2023.12.18.572279v1.full.pdf+html