0004-1-模型好坏评判标准

一 完善度

  • 汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例
  • 跨层引用率:ODS 层直接被 DWS/ADS/DM 层引用的表,占所有 ODS 层表(仅统计活跃表)比例
  • 快速响应业务方的需求

比较好的模型,使用方是可以直接从该模型获取所有想要的数据的,如果dws,ads,dm层直接引用ods层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化

二 复用度

模型引用系数:模型被读取并产出下游模型的平均数量

三 规范度

  • 主题域归属
  • 分层信息
  • 脚本及任务明明规范
  • 表命名符合规范(清晰、一致,见名知意)
  • 字段命名是依赖于词根

四 稳定性

能否保证日常的sla(时效保障)

五 扩展性

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评判一个机器学习模型好坏标准和各项指标有很多,以下是一些常见的指标: 1. 准确率(Accuracy):分类正确的样本数占总样本数的比例,适用于二分类和多分类问题。 2. 精确率(Precision):预测为正例的样本中,实际为正例的样本数占所有预测为正例的样本数的比例,适用于需要准确预测正例的问题。 3. 召回率(Recall):实际为正例的样本中,被预测为正例的样本数占所有实际为正例的样本数的比例,适用于需要尽可能找出所有正例的问题。 4. F1-score:综合考虑了精确率和召回率,是精确率和召回率的调和平均数。 5. ROC曲线:以假正例率(false positive rate,FPR)为横坐标,真正例率(true positive rate,TPR)为纵坐标,绘制出的曲线。曲线下面积AUC(Area Under Curve)越大,模型性能越好。 6. 混淆矩阵(Confusion Matrix):将实际结果和预测结果进行分类统计的矩阵。可以通过混淆矩阵计算出准确率、精确率、召回率等指标。 7. 均方误差(Mean Squared Error,MSE):回归问题中,预测值与实际值之间差的平方和的均值。 8. 均方根误差(Root Mean Squared Error,RMSE):回归问题中,均方误差的平方根。 9. 平均绝对误差(Mean Absolute Error,MAE):回归问题中,预测值与实际值之间差的绝对值的均值。 10. R^2(决定系数):回归问题中,模型的可决系数,表示模型对数据的拟合程度。R^2越接近1,模型的拟合程度越好。 不同的问题和场景需要使用不同的指标来评估模型好坏。需要根据具体的需求和情况来选择合适的评估指标。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据私房菜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值