教新手TCGA数据下载指引教程

简介

不写那么复杂的帖子,简单明了为主。方便自己记录,也方便他人学习。主要演示TCGA的数据如何下载,如果你

是官网下载那就是点击Launch Data Portal,就会跳到GDC Data Portal的这个页面上。我们会用到官方提供的工具GD

C Data Transfer Tool,也就是gdc-client传输工具去下载。

 

教程

先在主页的界面上点击Repository

在File和Cases中选择需要的

最后我们点击Add All Files to Cart

点击Cart

点击Download >> Manifest进行下载,下载的文件gdc_manifest_20221118_073510.txt 等候备用

接下来我们下载官方提供的工具点击GDC Data Transfer Tool

到工具的下载界面选对应你系统的客户端工具进行下载

win平台

win平台客户端gdc-client_v1.6.1_Windows_x64.zip,下载后解压出来放在了D盘gg的文件夹

打开运行 >> 输入 sysdm.cpl >> 打开系统属性 >> 高级 >> 环境变量 >> Path >>编辑

浏览添加D盘gg的文件夹,gdc-client就配置好了

打开CMD输入 gdc-client -h   来检测一下是不是正常

这里win的下载命令用到上面的 gdc_manifest_20221118_073510.txt 这个文件放在当前目录中,命令如下

gdc-client download -m gdc_manifest_20221118_073510.txt

linux平台

以ubuntu为例吧,gdc-client_v1.6.1_ubuntu_x64.zip我下面使用的官方文件包,下面列出来需要敲的命令

先下载文件,经测试美国芝加哥的IP挂起来是比较快的

wget https://gdc.cancer.gov/files/public/file/gdc-client_v1.6.1_Ubuntu_x64.zip

解压出来

unzip gdc-client_v1.6.1_Ubuntu_x64.zip

解压后得到的gdc-client文件,我们赋权

chmod +x gdc-client

最后我们开始下载

./gdc-client download -m gdc_manifest_20221118_073510.txt

下载完毕

THE END