[DM实战]中医症型关联规则挖掘

最新推荐文章于 2023-12-13 18:30:00 发布

xuweiling_

最新推荐文章于 2023-12-13 18:30:00 发布

阅读量1.9k

点赞数

分类专栏： Python数据分析与挖掘数据挖掘

本文链接：https://blog.csdn.net/u014630431/article/details/79053178

版权

1、发现中医症状间的关联关系和诸多症状间的规律性，并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。

根据数据实现以下目标：

1）借助三阴乳腺癌患者的病理信息，挖掘患者的症状与中医证型之间的关联关系。

2）对截断治疗提供依据，挖掘潜性证素。

2、数据获取：以问卷调查方式对数据进行收集，并将问卷信息整理成原始数据。（患者临床病理性息大部分都记录在纸张上，包含了患者的基本信息，具体患病信息等，很少会将患者的患病信息存放于系统中，因此进行数据分析时会面临数据缺乏的情况，针对这种情况采用问卷调查方式收集数据。）

3、数据预处理：本案例中数据预处理过程包括数据清洗、属性规约和数据变换。

1）数据清洗：在收回的问卷中，存在无效的问卷，为了便于模型分析，需要对其进行处理。

2）属性规约：本案例收集到的数据共有73个属性，为了更有效地对其进行挖掘，将其中冗余属性与挖掘任务不相关的属性剔除。

3）数据变换：本章数据变换主要采用属性构造和数据离散化两种方法对数据进行处理。首先通过属性构造获得症型系数，然后通过聚类算法对数据进行离散化处理，形成建模数据。

4、模型构建

本案例的目标是探索乳腺癌患者TNM分期与中医症型系数之间的关系，因此采用关联规则算法，挖掘它们之间的关联系数。

关联规则算法主要用于寻找数据集中项之间的关联关系。它揭示了数据项间的未知关系，基于样本的统计规律，进行关联规则挖掘。根据所挖掘的关联关系，可以从一个属性的信息来推断另一个属性的信息。当置信度达到某一阈值时，就可以认为规则成立。

#coding:utf-8
#数据聚类离散化代码

'''
聚类离散化，最后的result格式为：
       1          2          3          4
A      0   0.178698   0.257724   0.351843
An   240        356        281         53
即（0，0.178698]有240个，（0.178698,0.257724]有356个，依此类推
'''

import pandas as pd
from sklearn.cluster import KMeans    #导入K均值聚类算法

datafile = './data/data.xls'   #待聚类的数据文件
processedfile = './tmp/data_processed.xls

最低0.47元/天解锁文章

xuweiling_

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
[DM实战]中医症型关联规则挖掘

1、发现中医症状间的关联关系和诸多症状间的规律性，并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。根据数据实现以下目标：1）借助三阴乳腺癌患者的病理信息，挖掘患者的症状与中医证型之间的关联关系。2）对截断治疗提供依据，挖掘潜性证素。2、数据获取：以问卷调查方式对数据进行收集，并将问卷信息整理成原始数据。（患者临床病理性息大部分都记录在纸张上，包含了患者的基本信息，
复制链接

扫一扫