看过我TCGA肿瘤数据库知识图谱的小伙伴都知道如何在任意癌症查询指定感兴趣基因的表达量,并且对样本进行分组比较,网站是:https://xenabrowser.net/heatmap/
![7e80c4b7a436820465df7559d6e3f5c6.png](https://i-blog.csdnimg.cn/blog_migrate/ccf935522ff57092efae5a413619d271.jpeg)
根据视频教程拿到数据,很容易可视化如下:
![df1ddaccdfe15fecceb9ceb749cf9494.png](https://i-blog.csdnimg.cn/blog_migrate/aea744815cf43465ce8223ff03d736f4.jpeg)
可以得出结论,我们感兴趣的基因(这里是CUL5)在乳腺癌的正常组织及癌症组织(原位和转移)表达量,使用
单因素方差分析,得到了统计学显著的结果。
定义
单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而确定因素对试验结果有无显著性影响的一种统计方法。
- 因素:影响研究对象的某一指标、变量。
- 水平:因素变化的各种状态或因素变化所分的等级或组别。
- 单因素试验:考虑的因素只有一个的试验叫单因素试验。
了解数据
数据文件可以下载,然后读入R里面进行可视化