- 博客(5)
- 收藏
- 关注
原创 TCGA新版数据count的下载及转换为tpm
我以前是直接下载小洁老师存在网盘中的tpm的Rdata,然后我发现我分析的LAML数据总共是151例样本,但是小洁老师不知道为什么漏了一例,只有150例。强迫病犯了,少一例不能忍,所以就自己下载TCGA官网的数据,并进行count到tpm的数据转换。总共是60660行基因,和我们TCGA下载的表达矩阵的的基因是一一对应的,如果数量不对,那后面的所有结果都会有偏差,因为tpm的计算涉及样本测序深度的标准化,需要用到样本所有基因count数求和进行标化。最近想重新进行免疫浸润计算,用的是TCGA的数据。
2023-07-18 17:15:53 3716 13
原创 利用KEGGREST包提取所有代谢相关的基因
KEGG上的基因数量和通路数量都是不断更新的,所以KEGGREST包能提取的基因数量也在不断变化。我去年运行的时候总基因8192个,现在已经有8443个了,以后也会不断增加。KEGG官网上也有少量的代谢通路不以00开头,以01开头。数量太少,且不是重要的通路,所以我省略了。想要提取更全的基因基的朋友可以自己加上。写笔记主要是为了自己进步,也是方便自己查看。R语言新手,如有不对请指正。
2023-05-19 18:31:59 2448 7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人