机器学习算法基础-打卡-day1


可把我牛坏了,一个没有Python基础的人甚至还不咋会编程就又感报机器学习的学习小组了。果然很刺激,第一天的就是上次数据挖掘最后用来验证成果所使用的线性回归。
虽然见过但是再来一遍不怎么熟的还是不咋熟。

既然此次学习是基于机器学习的,作为一个其他空有9年号但是根本不是编程人的外行来从自己收集的资料里来介绍下什么是机器学习以及主流算法有哪些好了。

一、什么是机器学习

机器学习介绍
学习靠B站。通过互联网搜索,我粗浅的有个认知,那就是机器学习就是按照人所赋予的“类人”思维也就是相关算法(类比人的经验)对数据进行辨别或运算得出某类结果。其中机器学习也有一些分类,分为监督性学习、非监督学习及强化学习。这里上面所挂载的连接中有详细的介绍。

二、机器学习的算法

1、 监督式学习

工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。
监督式学习的例子:
线性回归、决策树、K – 近邻算法、逻辑回归等。

2、非监督式学习

工作机制:在这个算法中,没有任何目标变量或结果变量要预测或估计。这个算法用在不同的组内聚类分析。这种分析方式被广泛地用来细分客户,根据干预的方式分为不同的用户组。
非监督式学习的例子:
关联算法和 K – 均值算法。

3、强化学习

工作机制:这个算法训练机器进行决策。它是这样工作的:机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习,并且尝试利用了解最透彻的知识作出精确的商业判断。
强化学习的例子:
马尔可夫决策过程。

三、线性回归

利用数理统计中的回归分析,来确定两种或者两种以上变量间相互依赖的定量关系的一种统计分析方法。线性回归是机器学习中最基本的算法。

1、线性回归的目标

a、评估预测变量y在解释反应变量x的变异或表现时的显著性。
b、在给定预测变量值x的情况下预测反应变量值y。

2、线性回归的应用

a、预测,即建立一个模型(方程),基于反应变量y与其他预测变量x的关系来预测新的y值。
b、解释分析和探索式分析,即用于理解和解释反应变量和预测变量间的关系。

3、线性回归的类别

a、一元线性回归:只包括一个自变量和一个因变量,且二者关系可用一条直线近似表示。
b、多元线性回归:包括两个或两个以上的自变量,且因变量和自变量之间是线性关系

4、线性回归的目标函数、代价函数和损失函数

a、损失函数(Loss Function )是定义在单个样本上的,算的是一个样本的误差。
b、代价函数(Cost Function )是定义在整个训练集上的,是所有样本误差的平均,也就是损失函数的平均。
代价函数就是用来描述线性回归模型与正式数据之前的差异。如果完全没有差异,则说明此线性回归模型完全描述数据之前的关系。如果需要找到最佳拟合的线性回归模型,就需要使得对应的代价函数最小。
c、目标函数(Object Function)定义为:最终需要优化的函数。等于经验风险+结构风险(也就是Cost Function + 正则化项)。

5、线性回归模型的特点:

a、建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快。
b、可以根据系数给出每个变量的理解和解释。
c、对异常值很敏感。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值