71 方差偏差的分解公式
链接
sklearn)是针对Python 编程语言的免费软件机器学习库 [1] 。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,
72对应时间序列的数据集如何进行交叉验证(两种嵌套交叉验证)
传统的交叉验证由于假定样本独立同分布,因此随机打乱分为训练集和验证集。
但是对于时间序列来讲,需要考虑序列间的时间依赖。1.预测后一半;2.日向前链
73正负样本不平衡的解决办法?评价指标的参考价值?
1重新采样数据集:上下采样法。
2使用正确的评估标准,当数据不平衡时可以采用精度,调用度,F1得分,MCC,AUC等评估指标
好的指标:ROC和AUC、F值、G-Mean;不好的指标:Precision、Recall
74迁移学习
迁移学习就是把之前训练好的模型直接拿来用,可以充分利用之前数据信息,而且能够避免自己实验数据量较小等问题。简单来