《机器学习实战》(一)机器学习基础

关键术语

训练集:用于训练机器学习算法的数据样本集合

目标变量:机器学习算法的预测结果,其中分类算法--标称型,回归算法-连续型

知识表示:展示机器学习算法获取的信息,可以使规则集、概率分布、甚至训练样本集中的一个实例


主要任务

分类(classification):将实例数据划分到合适的分类中
回归(regression):预测数值型数据。例子:数据拟合曲线
分类和回归属于监督学习(supervised learning),监督学习需要知道目标变量的分类信息。

与监督学习对应的是无监督学习(unsupervised learning),数据没有类别信息,也没有目标值
聚类(clustering):将数据集合分成有类似的对象组成的多个类
密度估计(density estimation):寻找描述数据的统计值
无监督学习可以减少数据特征的维度。

算法选择

预测目标变量的值---监督学习
目标变量类型:离散型---分类;连续型---回归

不预测目标变量的值---无监督学习
将数据划分为离散的组---聚类
估计数据与每个组的相似程度---密度估计

开发应用程序步骤

  1. 收集数据
  2. 准备输入数据
  3. 分析输入数据
  4. 训练算法(监督学习)
  5. 测试算法
  6. 使用算法

Python语言的优势

语法结构清晰,流行,比matlab便宜,就是比C和JAVA慢了一点点

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值