用python对数据进行主成分分析、类概念描述及特征化分析-用户手册

sov_cc

已于 2022-12-29 15:54:53 修改

阅读量450

点赞数

分类专栏：数据挖掘文章标签： python 数据挖掘数据分析

于 2022-12-29 15:48:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Coral__/article/details/128483047

版权

数据挖掘专栏收录该内容

4 篇文章 0 订阅

订阅专栏

数据挖掘课程的期中实验，仅供参考。完成时间：2022.10.29
基本要求：利用python对数据集中的数据进行主成分分析、类概念描述及特征化分析。要有相关结果的可视化结果。比如数据的分布情况。
数据源是TCGA。
数据源及代码：
链接：https://pan.baidu.com/s/11CpKznSP66EAbPzMspRShA
提取码：sovc

相关文章：https://blog.csdn.net/Coral__/article/details/128482614

0.实验环境

操作系统：windows10

语言：python3.7.0

编译器：Visual Studio Code

配置要求：在电脑上任意编译器配好python环境即可，无特殊要求

我们需要将重点放在“源代码及数据集-赖紫馨-202008010204”中的“shujuwajue"文件夹。

1.data

此文件夹中有"BLCA"、“BRCA”、“KIRC”、“LUAD”、"PAAD"五个文件夹，其中的“rna.csv"文件是对应癌症的数据文件。

2.PCA.py（code文件夹中）

此代码对应的是主成分分析。

需要运行对应数据时，只需要修改下图横线的路径名称，然后直接运行就可以生成前两个主成分的散点图。

在这里插入图片描述

需要生成其他图时，可以将对应代码的注释取消掉。

图1

在这里插入图片描述

图2

在这里插入图片描述

图3

在这里插入图片描述

图4

在这里插入图片描述

3.characterization.py（code文件夹中）

这个代码对应的是类特征化分析，直接运行即可生成对应图。

我的类特征化分析依然依赖于主成分分析，将前三个主成分通过K-means聚类后，画出三维彩色散点图。（如下图）
在这里插入图片描述

需要运行其他数据时，只需要修改下图横线的路径名称。

在这里插入图片描述

4.compare.py（code文件夹中）

此代码对应的是类对比分析，直接运行即可生成对应图。

我的想法是每种癌症类型选了10个样本，前15个基因，通过折线图的方式，判断同一癌症的不同患者基因表达是否具有相似性。

结果显示是有相似性的。

在这里插入图片描述

需要运行其他数据时，只需要修改下图横线的路径名称。

在这里插入图片描述

5.shang.py（code文件夹中）

此代码对应的是信息增益和属性相关分析，直接运行即可得到对应文件中，两个基因数据之间的数据增益。

默认代码是分析“BLCA”中“A2BP1|54715”和“A2ML1|144568”两个基因数据的数据增益。

在这里插入图片描述

需要运行其他数据时，需要修改下图横线的路径名称及想要分析的基因名称。

在这里插入图片描述

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

sov_cc CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

41万+: 周排名

124万+: 总排名

2万+: 访问

: 等级

221: 积分

15: 粉丝

23: 获赞

11: 评论

277: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何租AutoDL上的服务器并连接到本地VSC进行操作【保姆级教程】
jhzmkqsy: 连接上了远程机，怎么打开文件夹呢
微博评论情感分类-代码
m0_64248604: 有数据集吗
微博评论情感分类-实验报告
m0_73987115: up，请问有没有训练的数据集
阿里云天池：心跳信号分类预测（LightGBM单模型实现）
楠楠要努力哦: 你好，方便发一下运行结果csv文件吗
阿里云天池：心跳信号分类预测（LightGBM单模型实现）
CSDN-Ada助手: 恭喜您撰写第17篇博客！标题中的内容听起来非常有趣。您通过使用LightGBM单模型实现心跳信号分类预测，展示了对阿里云天池的运用。这是一项非常有实际应用价值的技术，我对您的深入研究和实践能力表示佩服。在下一步的创作中，或许您可以考虑分享一些实践中遇到的挑战和解决方案，这对于读者来说是非常有帮助的。另外，您也可以尝试尝试使用其他算法或模型来解决类似的问题，以拓宽视野。我期待着您未来的创作，希望您一如既往地保持谦逊和努力！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。