python特征衍生_Python机器学习算法入门指南(全)

前言

机器学习 作为人工智能领域的核心组成,是计算机程序学习数据经验以优化自身算法,并产生相应的“智能化的”建议与决策的过程。

一个经典的机器学习的定义是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

1 机器学习概论

机器学习是关于计算机基于数据分布,学习构建出概率统计模型,并运用模型对数据进行分析与预测的方法。按照学习数据分布的方式的不同,主要可以分为监督学习和非监督学习:

0f28f495de86311d88cc0c78ccd47d35.png

1.1 监督学习

从有标注的数据(x为变量特征空间, y为标签)中,通过选择的模型及确定的学习策略,再用合适算法计算后学习到最优模型,并用模型预测的过程。

按照模型预测结果Y的取值有限或者无限的,可再进一步分为分类模型或者回归模型;

0e282a0a01dd4dfeb8e10b676e59411c.png

1.2 非监督学习:

从无标注的数据(x为变量特征空间),通过选择的模型及确定的学习策略,再用合适算法计算后学习到最优模型,并用模型发现数据的统计规律或者内在结构。

按照应用场景,可以分为聚类,降维和关联分析等模型。

fed235b2dbc2d5f663b5745ac39ae7e1.png

2 机器学习建模流程

93e2b601f8ef990e14b7fd7c7c7c18f7.png

2.1 明确业务问题

明确业务问题是机器学习的先决条件,这里需要抽象出现实业务问题的解决方案:需要学习什么样的数据作为输入,目标是得到什么样的模型做决策作为输出。

(如:一个简单的新闻分类问题的场景,就是学习已有的新闻及其类别标签数据,得到一个文本分类模型,通过模型对每天新的新闻做类别预测,以归类到每个新闻频道。)

d6f63db30e3a828ca4212ebbf221223e.png

2.2 数据选择:收集及输入数据

数据决定了机器学习结果的上限,而算法只是尽可能逼近这个上限。

意味着数据的质量决定了模型的最终效果,在实际的工业应用中,算法通常占了很小的一部分,大部分工程师的工作都是在找数据、提炼数据、分析数据。数据选择需要关注的是:

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习算法有很多种,以下是其中一些常见的算法及其衍生算法: 1. 线性回归(Linear Regression):基础的机器学习算法,用于解决连续型变量的预测问题。其衍生算法包括岭回归(Ridge Regression)、套索回归(Lasso Regression)等。 2. 逻辑回归(Logistic Regression):用于解决分类问题,主要应用于二分类问题。其衍生算法包括多项式逻辑回归(Polynomial Logistic Regression)等。 3. 决策树(Decision Tree):用于处理分类问题和回归问题,通过一系列的判断条件构建决策树,从而实现对数据的分类和预测。其衍生算法包括随机森林(Random Forest)、梯度提升树(Gradient Boosting Tree)等。 4. 支持向量机(Support Vector Machine):用于解决分类和回归问题,通过寻找最优的分类边界来实现分类或预测。其衍生算法包括核支持向量机(Kernel SVM)等。 5. 聚类算法(Clustering):用于对数据进行分组,将相似的数据归为一类,不同的数据归为不同的类别。其衍生算法包括层次聚类(Hierarchical Clustering)、K-Means 等。 6. 神经网络(Neural Network):用于解决分类和回归问题,通过模拟人脑的神经元工作原理,实现对数据的分类和预测。其衍生算法包括卷积神经网络(Convolutional Neural Network)、循环神经网络(Recurrent Neural Network)等。 这些算法及其衍生算法在实际应用中都有着广泛的应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值