非监督学习应用练习
本次中,我们将对数据降维和聚类方法的工作原理进行练习。
我们将使用三星提供的 * Human Activity Recognition 活动识别数据集* 。这些数据来自三星 Galaxy S3 手机的加速度计和陀螺仪,你可以通过上面的链接找到有关这些功能的更多信息)。这些活动类型包括:走路,站立,躺下,坐着或爬楼梯。
接下来的挑战过程中,我们首先假装不了解活动的类型,并尝试纯粹基于特征对样本进行聚类。然后,我们将确定身体活动类型的问题解决为分类问题。
我们先导入本次挑战可能会用到的模块和函数。
from sklearn.svm import LinearSVC
from sklearn.prep