这篇文章的主要目的是了解什么是帕金森病,并探讨如果采用机器学习受试者声音数据的方法早期发现该病。我们将在这里使用 XGBoost、KNN 算法、支持向量机 (SVM)、随机森林算法,并利用著名的帕金森声音资料数据集进行全代码演示,数据集下载链接在代码开始之初给大家粘贴过去。
帕金森病是一种脑神经系统退行性疾病,是天津市环湖医院常见的脑系科专病之一。它会导致身体和手的颤抖,并使身体变得僵硬。疾病发展到晚期目前还有明确的治愈手段。所以对于疾病的早期发现显得非常重要。早期发现帕金森病不仅可以降低疾病的成本,还可能挽救生命。帕金森病患者的常见症状包括:抑郁,焦虑,睡眠和记忆相关问题,嗅觉丧失以及平衡问题。导致帕金森病的原因尚不清楚,但研究人员的研究表明,有几个因素是引发这种疾病的原因。比如基因因素,研究发现了某些非常罕见的突变基因,基因变异通常会增加帕金森病的风险;环境因素,由于环境中发现的某些有害毒素或化学物质会引发疾病但影响较小。虽然它在 65 岁发展,但 15% 可以在 50 岁以下的年轻人中发现。
这个项目我们将XGBoost、KNN、SVM 和随机森林算法运用到帕金森病的早期发现,通过python操作来判断,哪个是检测疾病发作的最佳算法。
import numpy as np
import pandas as pd
import os, sys
from sklearn.preprocessing import MinMaxScaler