【译】微软 azure -- 机器学习算法选择的步骤

原文:
https://azuremlsimpleds.azurewebsites.net/simpleds/




预测值


实例场景:
估计产品需求
预测销售数据
决定设备服务优先级


算法选择:
序数回归:类别是有序的
泊松回归:预测事件次数
快速森林分位数回归:预测一种分布
线性回归:快速训练,针对线性模型
贝叶斯线性回归:针对线性模型,小数据集
神经网络回归:预测较精确,但训练时间长
决策森林回归:较精确,训练快速,手工选择特征
提升决策树回归:精确,训练快速,占用较大内存



找出异常情况


实例场景:
预测信用风险
欺诈检测
捕获异常设备读取


算法选择:
一元SVM:100个特征以内
基于PCA的异常检测:训练快速


聚类(结构挖掘)
实例场景:
客户分类
预测客户口味
决定哪种产品会以同样的原因失败


算法选择:
K-Means



两种类别中预测某类别

实例场景:
某观点是否乐观
客户是否会续约
哪种优惠券吸引更多客户


算法选择:
二元SVM:少于100个特征,线性模型
二元平均感知器:快速训练,线性模型
二元贝叶斯点机:快速训练,线性模型
二元决策森林:精确,训练快速
二元逻辑回归:训练快速,线性模型

二元提升决策树:精确,训练快速,但占用较多内存


二元决策丛林:精确,使用内存较少(相比决策森林)

相对于决策树而言,解决了在训练数据非常大的情况下,节点指数增长的问题。

更多二元决策丛林的资料

二元本地深度SVM:少于100个特征
二元神经网络:精确,但训练时间长



多个类别中预测某类别
实例场景:
这条微博的心情是什么
这个客户会选择哪种服务
哪几种优惠会吸引更多客户


算法选择:
多元逻辑回归:快速训练,线性模型
多元神经网络:精确,训练时间长
多元决策森林:精确,训练时间短
多元决策丛林:精确,占用内存少(相比决策森林)
多元分类(One vs All):取决于二元分类器

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值