机器学习实验报告-实验名称: 音乐流行度预测报告及源码
如果某个变量与其他变量高度线性相关,那么这个变量可以被其他变量很好地预测,其2将接近 1,导致 VIF 值很高,表明存在多重共线性问题.key 和 time_signature 属性由于其是有序离散属性,我认为其中的顺序关系可直接用于线性模型的训练,并不需要进行连续化。在观察预测值-真实值散点图时也可以发现大部分预测值集中在 50 附近,并没有出现预测值与真实值的正相关关系,这也说明模型没有很好的利用到属性值来进行预测。将数据的属性值和标签值进行可视化,初步观察数据的分布情况。
复制链接