机器学习(一)

经典定义:

利用经验改善系统自身的性能。

经典的机器学习过程:

基本术语:

数据集:训练集、测试集

示例、样例、样本

属性、特征:属性值

属性空间、样本空间、输入空间

特征向量

标记空间、输出空间

归纳偏好(偏置):

任何一个有效的机器学习算法必有其偏好

学习算法的归纳偏好是否与问题本身匹配,大多数直接决定了算法能否取得好的性能

泛化能力:对新的未见过的处理能力强。

一、到底要什么

二、给的是不是想要的

泛化误差:在“未来”样本上的误差

经验误差:在训练集上的误差,亦称“训练误差”

过拟合 VS 欠拟合

三大问题:

一、如何获得测试结果 (评估方法)

关键:怎么获得“测试集”

测试集应该与训练接“互斥”

常见方法有:留出法、交叉验证法、自助法

k-折交叉验证法

调参与最终模型:

算法的参数:一般由人工设定,亦称“超参数”

模型的参数:一般由学习确定

调参本身就是一种对模型的选择,

二、如何评估性能优劣 (性能度量)

性能度量是衡量模型泛化能力的评价标准,反映了任务需求。

错误率、精度、查准率、查全率、F1度量

三、如何判断实质差别 (比较检验)

统计解设检验为学习器性能比较提供了重要依据。

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
很高兴看到中国在机器学习(MachineLearning,ML)领域所取得的进展。随着机器学习的推出和普及,它被嵌入到许多应用中。它成功地以无形、内嵌的方式存在于众多应用中,很多人都在日常生活中使用它,但是并没有意识到它的存在。从在百度中输入一个搜索词到预约一次滴滴打车,这些操作都是基于多层机器学习应用构建的。   在我们的生活中,机器学习确实无处不在,它增加了价值,产生了积极的经济效应,同时减少了低效和浪费。这是由多方面的因素推动形成的,包括显著改进的神经网络(NN)框架,成熟的机器学习技术,改善的训练数据访问方法,当然还有一点很重要的就是,性能更佳的、嵌入在边缘和终端用于训练的专用集成电路(ASIC)。再加上更好的机器学习训练算法——在一些情况下可以将训练时间从数周减少到数小时,机器学习正变得越来越可行。   我们现在看到的是,即使没有连接到云端,也可以在边缘以卓越的帧率(每秒的推理次数)执行推理,而放在几年前,这只有在数据中心才可以实现。由于推理可以在边缘进行,因此开启了更多的机会。   中国市场已经受益于对机器学习和人工智能(AI)的长期关注与持续投资,并造就了多种高效的机器学习框架,例如百度飞桨(PaddlePaddle,即PArallelDistributedDeepLEarning,并行分布式深度学习),华为的MindSpore和旷视科技的Brain++。此外,阿里巴巴也投资打造了阿里云城市大脑,旨在支持智慧城市的运行,并通过其下属的芯片设计企业平头哥半导体投身于人工智能芯片的研发。   无论从大学、研究者,还是从蓬勃发展的企业部门来看,中国在机器学习著作和专利方面都处于领先地位,我们正在见证中国在所有领域展示其成熟的机器学习创新、开发和应用能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

几两春秋梦_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值