TCGA超过1G的病理wsi数据下载-gdc-client

使用网页端下载TCGA超过1G的病理wsi数据,数据下载到1G后就不能完整下载。遂采用gdc-client下载。

Win 环境下新建这个文件夹放在系统盘进行储存,否则会报错:ERROR: Unable to write state file: [WinError 17] 系统无法将文件移到不同的磁盘驱动器。好像是

TCGA数据集下载及gdc-client相关问题汇总_gdc client error-CSDN博客

gdc-client软件及环境

下载GDC Data Transfer ToolGDC (cancer.gov)

安装到自己需要的位置,英文路径,Windows需要进行环境变量配置
打开电脑控制面板——系统和安全——系统——高级系统设置——环境变量——Path——“加入你的gdc-client所在路径” (点击放置gdc-client的文件夹名复制即可),然后应用保存。

TCGA数据下载教程:使用官方gdc-client软件下载-CSDN博客

打开CMD命令行窗口输入  gdc-client -h  然后回车,成功将会显示:

gdc-client -h

Manifest及病理svs数据下载

将需要下载的数据从TCGA上加入购物车,然后下载Manifest.txt文件

将文件放置于配置环境变量及gdc软件的文件夹

然后右击选在→在终端中打开(cmd)输入“gdc-client download -m gdc_manifest自己的.txt”回车下载

gdc-client download -m gdc_manifest自己的.txt

现在即可下载超过1G的病理WSI文件。

接下来就可以使用qupath软件进行查看和分析

Projects — QuPath 0.5.0 documentation

TCGA的gdc-client的下载优化_gdc 下载没速度-CSDN博客

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
利用多实例学习(Multiple Instance Learning, MIL)对WSI(Whole Slide Imaging)图像进行分割的一般步骤如下: 1. 数据准备: - 获取WSI图像数据集,其中每个WSI图像可能包含多个区域,每个区域可能包含多个实例(例如细胞)。 - 对每个WSI图像,标注出感兴趣区域(Region of Interest, ROI)以及相应的实例标签。 2. 特征提取: - 针对每个ROI,提取特征来表示该区域的视觉信息。常用的特征包括颜色直方图、纹理特征、形状特征等。 3. 实例级别标签生成: - 对于每个ROI,根据其中的实例标签生成一个实例级别的标签。有多种方法可用,例如:包含正样本的ROI标记为正例,不包含正样本但包含负样本的ROI标记为不确定例,不包含任何样本的ROI标记为负例。 4. 多实例学习模型训练: - 使用MIL算法进行模型训练。MIL是一种弱监督学习算法,其中每个训练样本都由一个或多个实例组成,并且样本级别的标签只有正例和负例。 - 常用的MIL算法包括经典的MIL算法、MIL with Multiple Instance Representation (MIL-MIR)等。 5. 分割预测: - 对于新的WSI图像,首先对其进行分割,得到多个ROI。 - 对于每个ROI,提取特征,并使用训练好的MIL模型进行预测。根据预测结果,可以得到每个ROI的实例级别的标签。 需要注意的是,WSI图像的分割是一个复杂任务,常常需要使用深度学习等方法,并结合大量的标注数据和计算资源来训练和优化模型。同时,还需要根据具体应场景进行一些调整和改进,以获得更好的分割效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值