机器学习算法与流程

一、机器学习算法是一类通过自动分析从数据中获得规律,并利用规律对末知数据进行预测的
算法,可以分成有监督学习、无监督学习、强化学习等类别。
(1)有监督学习是从有标记(注)的训练数据中学习一个模型,然后根据这个模型对未知样本进行项測。其中,模型的输人是某一样本的特征,两数的输出;是这一样本对应的标签。常见的有监督学习算法包括回归分析和统计分类。有监督学习包括分类和数字预测两大类别,前者包括逻弄回归、决策树、KNN、随机森林、支持向量机、朴素贝叶斯等,后者包括线性回归、XNN、梯度提升(Gradient Boosting)和自适应提升 ( Adaptive Boosting AdaBoost ) 等。
(2)无监督学习又称为非监督学习,它的揄人样本并不需要标记,而是自动从样本中学习待征实现预測。常见的无监督学习算法有聚类和关联分析等,在人工神经网络中,自组织映像
(SelfOrganizafion Mapping, SOM)和适应谐振理论 ( Adaptive Resonance Theory, ART)是最常用的无监督学习。
(3)强化学习是通过观察来学习做什么样的动作。每个动作都会对环境有所影响,智能体根据观寮到的周围环境的反馈来做出判断。强化学习强调与环境交互学习合适的行动策略,以取得最大化的预期利益。其灵感源于心理学中的行为主义理论,即有机体如何在环境给子的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。
根据机器学习的任务分类,常见机器学习任务可以分为分类、聚类、回归等类型。某些机器学习算法可能同时屆于不同的分类,如深度学习算法可能存在于有监督学习,也可能用于强化学习,在实践过程中可依据实际需要进行选择。
熟悉各类分析方法的特性是分析方法选择的基础,不仅需要了解如何使用各类分析算法,还要了解其实现的原理,这样在参数优化和模型改进时可减少无效的调整。在选择模型之前要对数据进行探素性分析,了解数据类型和数据特点,发现各 自变量之间的关系以及自变量与因变量的关系。特别注意,在维度较多时容易出现变量的多重共线性问题,可应用箱图、直方图、散点图查找其中的规律性信息。
模型选择过程中先选出多个可能的模型,然后对其进行详细分析,并选择其中可用于分析的模型,在选择自变量时,大多数情况 下需要结合业务来手动选择自变量。在选择模型后,比我不同模型的拟合程度,可统计显著性参数、尺、调整尺、最小信息标准、BIC 和误差谁则、Mallow's Cp 准则等。在单个模型中可将数据分 为训东集和测试集,用来做交叉验证并分析结果的稳定性。反复调整参数使模型趋于稳定和高效。

1. 分类算法
分类算法是应用分类规则对记录进行目标映射,将其划分到不同的分类中,构建具有泛化能力的算法模型,即构建映射规则来预测未知样本的类别。
主要的分类算法包括决策树、支持向量机(Support Vector Mactine, SVM) 、KNN、贝叶斯网络(Bayesian Network)和神经网络等。

2.聚类算法
聚类是基于无监督学习的分析模型,不需要对原始数据进行标记,按照数据的内在结杓特征进行聚集形成族群,从而实现数据的分高。聚类与分类的主要区别是其并不关心数据是什么类别,而是把相似的数据聚集起来形成某一类筷。
在聚类的过程中,首先选择有效特征构成向量,然后按照欧氏距离或其他距离函数进行相似度计算,并划分聚类,通过对聚类结果进行评估,逐渐选代生成新的聚类。
聚类应用领域广泛,可以用于发现不同的企业客户群体特征、消费者行为分析、市场细分、交易数据分析、动植物种群分类、医疗领域的疾病诊断、环境质量检测等,还可用于互联网和电商领城的客户分析、行为特征分类等。在数据分析过程中,可以先用聚类对数据进行探素,发现其中蕴含的类别特点,然后用分类等方法分析每一类的特征。
聚类方法可分为基于层次的聚类、基于划分的聚类、基于密度的聚类、基于约束的聚类、基于网络的聚类等。

3、关联分析主要包括 Apriori 算法、FP-growth 算法和Eclat算法。

4、回归分析:线性回归、逻辑回归、多项式回归、岭回归、LASSO回归。

二、学习流程:

1、明确目标任务

2、收集数据

3、数据预处理

4、数据建模

5、模型训练

6、模型评估

7、模型应用

6c693a7443bf4bcaae782c7e1f65d202.png

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值