机器学习基础概念

机器学习简单的说就是把无序的数据转化为有用的信息。机器学习横跨多门学科,包括计算机科学、工程技术、统计学等。


特征向量:数据属性的集合,通常用向量来表示

训练集:用来训练,也就是产生模型和算法的数据集

监督学习:知道预测什么,即知道目标变量的分类信息。分类和回归属于监督学习

无监督学习:数据没有类别信息,也不会给定目标值

半监督学习:有标记的训练集+无标记的训练集


监督学习中常用的算法

k-邻近算法:线性回归

朴素贝叶斯算法:局部加权线性回归

支持向量机:Ridge回归

决策树:Lasso最小回归系数估计


无监督学习常用算法

k-均值:最大期望算法

DBSCAN:Parzen窗设计


算法选择

(1)预测目标变量值——>Y/N——>有监督学习/无监督学习

(2)离散型(是/否、1/2/3)——>分类算法

(3)连续型数值——>回归算法


开发步骤

(1)收集数据

(2)准备输入数据

(3)分析输入数据

(4)训练算法

(5)测试算法

(6)使用算法


结语:“脱离业务和数据的算法讨论是毫无意义的”


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值