机器学习--监督学习以及无监督学习案例

监督学习以及无监督学习案例

课件以吴恩达机器学习案例进行分享作为加深印象
附上github链接: 吴恩达机器学习课程的教学文档.

监督学习

  • 监督学习是指
    • 我们给算法一个数据集,其中包含了正确答案,举个例子就是说,我们给他一个房价数据集,在数据集中的每一个样本,我们都给出正确的价格,即这个房子的实际卖价
    • 如下图给出的图片表示我们能清晰的看到已经给出了确定的样本值
      在这里插入图片描述
    • 算法的目的就是给出更多的正确答案
      • 例如,为你朋友想要卖掉的这所新房子给出估价用更专业的术语来定义它也被成为"回归问题"
      • 这里的回归是指我们想要预测连续的数值输出,也就是价格,技术上而言,价格能够被圆整到分,因此价格实际上是一个离散值但通常我们认为房价是一个实数,标量或是连续值
      • 回归这个术语是指:我们设法预测连续值的属性
      • 分类这个术语是指:其目的是预测离散值输出
练习问题分类解析
  • 回归问题
    • 有很多同一件货物的库存,假设有几千件相同的货物要卖,你想预测,你在接下来的三个月内能,卖出去多少件
    • 问题解答:
      • 假设有几千个货物,将它看成一个实数。即一个连续的值,即把我要卖的货物数量看成一个连续的值
  • 分类问题
    • 你有很多用户,你想要写一个软件,来检查每一个客户的账户,对于每个客户的账户,判断这个账户是否被入侵或破坏
    • 问题解答:
      • 可能会设置我要预测的值为0,表示账户没有被入侵,设置值为1表示已经被入侵,用一个算法来计算这两个的离散值,因为只有少量的离散值,我把他作为一个分类的问题

无监督学习

  • 无监督学习是指:
    • 在无监督学习中,我们所用的数据和之前不同,看上去没有任何标签,都具有相同的标签或者都没有标签,我们得到一个数据集,我们不知道要拿它来干什么,也不知道每个数据点究竟是什么,我们只被告知这是一个数据集。
    • 对于给定的数据集,无监督学习算法可能判定,该数据集包含两个不同的簇,无监督学习可以把这些数据分成两个不同的簇,这就是"聚类算法"
    • 如下图给出的图片表示我们能清晰的看到数据集中有相同的标签
      在这里插入图片描述
  • 应用聚类算法案例一:
    • 新闻网站:比如一个石油泄漏的事故报道,如果点击网页中的一个URL可能会得到不同的新闻,这里就是一则关于石油泄漏的新闻。如果点击另一个连接,又会出现不同的新闻,也会出现石油泄漏的新闻,所以这个新闻网站所做的就是,去搜索成千上万的新闻,然后自动地将他们分簇有关同一主题的新闻被显示在一起
    • 其实聚类算法和无监督学习算法也可以用于许多其他的问题
  • 应用聚类算法案例二:
    在这里插入图片描述
    • DNA:基本的思想就是定一组不同的个体,对于每个个体检测他们是否 拥有某个特定的基因,也就是表达特定基因的表达程度
      这些颜色红绿灰等等,展现了不同个体,拥有特定基因的程度,我们要做就是运行一个聚类算法把不同的个体归入不同的类,或归为不同类型的人这就是无监督学习
      因为我们没有提前告知这个算法这些是第一类人,或是第二类人等等,相反我们只是告诉算法这儿有一堆数据,我不知道这些数据是什么,我不知道谁是什么类型,我甚至不知道都有哪些类型
练习问题分类解析
  • 监督学习
    • 给定被标记为垃圾邮件/非垃圾邮件的电子邮件,学习垃圾邮件过滤器。,因此我们将此视为一个监督学习问题
    • 给定一个诊断为糖尿病或非糖尿病患者的数据集,学习将新患者分类为糖尿病或非糖尿病患者。
  • 无监督学习:
    • 新闻故事的例子,给定在网上找到的一组新闻文章,将它们分成关于同一故事的一组文章。(使用聚类算法来将相同文章聚合在一起)
    • 给定一个客户数据数据库,自动发现细分市场,并将客户划分为不同的细分市场。
  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 唐宇迪-机器学习经典案例.zip 是一个文件压缩包,其中收集了唐宇迪在机器学习领域的经典案例机器学习是一种人工智能的分支领域,其目标是通过从数据中学习来实现一定的任务。唐宇迪是在机器学习领域非常有影响力的学者和专家,他的研究和贡献深受广大学术界和业界的认可。 这个压缩包包含了一系列机器学习的经典案例,这些案例可以帮助学习者更好地理解机器学习的原理和应用。案例的内容可能涉及到机器学习的基本概念、常见算法和实践经验等方面。通过学习这些案例,人们可以掌握机器学习算法的基本原理,了解其在实际问题中的应用以及解决方法。 值得注意的是,唐宇迪在机器学习领域的案例专辑可能包含不同的主题,例如监督学习、无监督学习、深度学习、强化学习等等。每个案例可能包含了相关的数据集、代码实现和详细解释。学习者可以根据自己的兴趣和需求,选择合适的案例进行学习和实践。 通过深入学习和理解唐宇迪的机器学习经典案例,人们可以拓宽对机器学习的认知,并将其应用到实际的问题中。这些经典案例对于机器学习爱好者、从业人员以及研究者都具有重要的参考价值。最终,希望这个压缩包能够为广大机器学习学习者提供有力的学习资源,推动机器学习领域的研究和发展。 ### 回答2: 唐宇迪-机器学习经典案例.zip 是一份压缩文件,其中收录了机器学习领域的经典案例资料。机器学习是一种人工智能的领域,致力于开发能够自主学习的计算机程序。这些案例资料有助于学习者更好地理解和应用机器学习算法。 在这份压缩文件中,我们可以找到不同领域的机器学习案例,涵盖了分类、回归、聚类、强化学习等多个方向。通过这些案例,学习者可以了解不同算法的原理与应用场景,并学会如何利用机器学习来解决实际问题。 比如,其中可能包括图像分类案例,通过训练机器学习模型,可以自动将图像分为不同的类别,比如猫、狗、汽车等。还可能包括预测房价案例,通过历史的房价数据来训练模型,实现对未来房价的预测。另外,诸如文本情感分析、推荐系统等案例也可能被包含在其中。 唐宇迪-机器学习经典案例.zip 可以为机器学习初学者提供一个学习的资料库,同时也对于已经入门的学习者来说是一个很好的实践和巩固知识的机会。通过实践这些案例,学习者可以更好地理解机器学习的原理和算法,并掌握如何运用这些算法来解决实际问题。 总之,唐宇迪-机器学习经典案例.zip 是一份宝贵的学习资源,对于学习和应用机器学习算法的人来说具有很大的帮助和指导作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值