应用机器学习 Applied Machine Learning (AML) ppt2

分类 classification

在目前的机器学习工作中,最常见的三种任务就是:

  1. 回归分析

  2. 分类分析

  3. 聚类分析

什么是「分类」

虽然我们人类都不喜欢被分类,被贴标签,但数据研究的基础正是给数据“贴标签”进行分类。类别分得越精准,我们得到的结果就越有价值。

分类是一个有监督的学习过程,目标数据库中有哪些类别是已知的,分类过程需要做的就是把每一条记录归到对应的类别之中。由于必须事先知道各个类别的信息,并且所有待分类的数据条目都默认有对应的类别。

分类分为两种:

  1. 二元分类:当我们必须将给定数据分类为 2 个不同的类时。示例——根据一个人的特定健康状况,我们必须确定该人是否患有某种疾病。

  2. 多类分类:类的数量超过2。例如——根据不同种类的花的数据,我们必须确定我们的观察属于哪个种类。

区分「聚类」与「分类」

分类的目的是为了确定一个点的类别,具体有哪些类别是已知的,常用的算法是 KNN (k-nearest neighbors algorithm),是一种有监督学习。聚类的目的是将一系列点分成若干类,事先是没有类别的,常用的算法是 K-Means 算法,是一种无监督学习。

两者也有共同点,那就是它们都包含这样一个过程:对于想要分析的目标点,都会在数据集中寻找离它最近的点,即二者都用到了 NN (Nears Neighbor) 算法。

一维分类问题 1D Classifcation Problem

 

本例子中一共有8条数据,每条数据格式(花瓣长度,类别)。不难看出第一类花花瓣都小于4cm,第二类花花瓣都大于4cm。机器学习模型也会学到这个特征,进行预测。

对于连续的特征,一个明

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Scala:Applied Machine Learning by Pascal Bugnion English | 23 Feb. 2017 | ISBN-13: 9781787126640 | 1843 Pages | EPUB/PDF (conv) | 33.15 MB Leverage the power of Scala and master the art of building, improving, and validating scalable machine learning and AI applications using Scala's most advanced and finest features. About This Book Build functional, type-safe routines to interact with relational and NoSQL databases with the help of the tutorials and examples provided Leverage your expertise in Scala programming to create and customize your own scalable machine learning algorithms Experiment with different techniques; evaluate their benefits and limitations using real-world financial applications Get to know the best practices to incorporate new Big Data machine learning in your data-driven enterprise and gain future scalability and maintainability Who This Book Is For This Learning Path is for engineers and scientists who are familiar with Scala and want to learn how to create, validate, and apply machine learning algorithms. It will also benefit software developers with a background in Scala programming who want to apply machine learning. What You Will Learn Create Scala web applications that couple with JavaScript libraries such as D3 to create compelling interactive visualizations Deploy scalable parallel applications using Apache Spark, loading data from HDFS or Hive Solve big data problems with Scala parallel collections, Akka actors, and Apache Spark clusters Apply key learning strategies to perform technical analysis of financial markets Understand the principles of supervised and unsupervised learning in machine learning Work with unstructured data and serialize it using Kryo, Protobuf, Avro, and AvroParquet Construct reliable and robust data pipelines and manage data in a data-driven enterprise Implement scalable model monitoring and alerts with Scala In Detail This Learning Path aims to put the entire world of machine learning with Scala in fron
Power BI 是一款强大的业务分析工具,然它本身不提供机器学习算法,但可以通过与其他机器学习平台或编程语言集成来实现机器学习功能。 以下是一些使用 Power BI 进行机器学习的常见方法: 1. 使用 Power Query 和 R 或 Python:Power BI 支持使用 Power Query 连接数据源,并通过 R 或 Python 脚本进行数据处理和分析。你可以使用这些脚本调用机器学习算法库,如 scikit-learn 或 TensorFlow,从而实现数据挖掘和预测分析。 2. 使用 Azure Machine Learning:Power BI 可以与 Microsoft Azure Machine Learning (AML) 集成,通过 AML 的 API 创建和部署机器学习模型,并将其嵌入到 Power BI 报表中。这样,你可以在 Power BI 中使用已经训练好的模型进行预测和推断。 3. 使用 Power Apps 和流程:Power Apps 和流程是 Power Platform 的一部分,它们可以与 Power BI 集成,实现低代码的机器学习工作流。你可以创建自定义的应用程序和自动化流程,处理数据并应用机器学习算法。 4. 使用第三方插件和扩展:除了上述内置的功能和集成,Power BI 还有许多第三方插件和扩展可供选择。这些插件通常提供了更高级的机器学习功能,如聚类、分类、回归等。你可以根据需要选择适合的插件,并将其整合到 Power BI 中。 需要注意的是,虽然 Power BI 可以用于展示和可视化机器学习结果,但它并不是一个完整的机器学习平台。对于复杂的机器学习任务,可能需要结合其他专业的机器学习工具和平台来进行模型训练和调优。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值