《深入浅出Python机器学习》读书笔记 第一章 概述


前言

《深入浅出Python机器学习》读书笔记,第一章概述


提示:以下是本篇文章正文内容

一、什么是机器学习

本意是指一种让计算机不经过明显编程的情况下,对数据进行学习,并且做出预测的方法,数据计算机科学领域的一个子集。

二、机器学习的一些应用场景

  1. 智能推荐。例如淘宝的商品推荐,网易云音乐的歌曲推荐
  2. 社交网络中的效果广告。给用户推送合适的广告
  3. 互联网金融中的风控系统。根据过往数据,判断当前订单是否
    是欺诈订单
  4. 新闻资讯中的内容审查。判断新闻是否是虚假新闻,或者内容
    是否违反国家 法律
  5. 其他领域。如医疗中根据病史症状和化验结果找到病因;
    智能物流、智能家居、无人驾驶等领域。
  6. AlphaGo

三、学习机器学习的过程

  1. 掌握一门语言
  2. 学习机器学习的基本概念
  3. 了解常见的算法
  4. 掌握数据处理的技巧
  5. 优化模型
  6. 动手

四、有监督学习和无监督学习

  1. 有监督学习是通过现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。有监督学习中,训练数据集一般包含样本特征变量及分类标签,机器学习使用不同的算法通过这些数据推断出分类的方法,并用在新的样本中。

  2. 无监督学习是在没有训练数据集的情况下,对没有标签的数据分析并建立合适的模型,一遍给出解决方案的方法。在无监督学习中,场景的两种任务类型是数据转换和聚类分析。数据转换的目的是把复杂数据通过非监督算法进行简化。常见的转换方法是数据降维:通过对数据集进行分析,将无关紧要的维度去除,保留关键特征。聚类是把相似特征的数据分到不同的组。

五、分类和回归

  1. 分类是对样本的类标签进行预测,判断样本属于哪个类别。通常分类是离散
    的数值。

  2. 回归分析是要预测一个连续的数值或范围。

六、模型的泛化、过拟合与欠拟合

  1. 模型的泛化是指模型用来预测新数据时的好坏,如果对新数据预测依然准
    确,说明泛化的准确度较好。

  2. 过拟合是指拟合训练数据集时拟合很好,拟合测试数据集市很差的情况

  3. 欠拟合指模型连训练数据集都拟合不好,测试数据集也很差的情况

下一篇:基于Python语言的环境配置

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值