![v2-c1601809407f0e606ed24148e0615c43_1440w.jpg?source=172ae18b](http://img-02.proxy.5ce.com/view/image?&type=2&guid=d745599d-1d2a-eb11-8da9-e4434bdf6706&url=https://pic2.zhimg.com/v2-c1601809407f0e606ed24148e0615c43_1440w.jpg?source=172ae18b)
今天继续我们的TCGA数据分析系列。
TCGA数据下载
TCGA数据下载的方式有很多,本次我们利用UCSC Xena数据库下载数据.该平台内置了一些公共数据集,比如来自TCGA, ICGC等大型癌症研究项目的数据,不仅可以对数据进行分析,而且还提供了对应文件的下载功能。
![v2-9c32a4aa611a3c1fa7fb0c61124f6d1c_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=d745599d-1d2a-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-9c32a4aa611a3c1fa7fb0c61124f6d1c_b.jpg)
打开后界面是这样的
![v2-8b8982e49c842f967f91be5d09701cf6_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=d745599d-1d2a-eb11-8da9-e4434bdf6706&url=https://pic3.zhimg.com/v2-8b8982e49c842f967f91be5d09701cf6_b.jpg)
点击DATA SETS,里面有很多数据集,我们选择TCGA肝癌数据
![v2-6e58568daa66e2390851a75dcd642fc4_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=d745599d-1d2a-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-6e58568daa66e2390851a75dcd642fc4_b.jpg)
接着我们选择HTSeq-Count
![v2-74b9aeeb0cb139ea1acce1946793bac2_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=d745599d-1d2a-eb11-8da9-e4434bdf6706&url=https://pic3.zhimg.com/v2-74b9aeeb0cb139ea1acce1946793bac2_b.jpg)
这里可以看到值log2(count+1),为什么加一呢,因为很多基因的表达值是0,无法取log。