机器学习第一步,从向量和矩阵开始!

全文共1466字,预计阅读时长2分钟

熟练掌握C语言却总是在转型机器学习算法的道路上屡屡跌倒?懂得AI模型的逻辑却在每次伪代码修改后都被报错?
你的绊脚石或许不仅仅是对于Python语法的陌生,还有对于数据集的处理摸不着头脑。

这时候,就需要我们回归基本概念——从向量、矩阵开始,读懂机器学习语言。

不同在何处?

在一般性C语言编程中,对于数据的处理主要利用指针。

熟悉它的同学们都知道,所谓内存,其实可以被视作一栋有许多房间的旅馆,数据按照特定顺序存在于这些房间之中。而指针,就是房间的门牌号。每一个指令的下达,就是依据编号敲开对应的门,而不用每一次处理之前,都得对房内的具体数据有所了解。

在这里插入图片描述

但机器学习的逻辑却与这完全不同。如果说前者是演绎法,那么机器学习则是归纳法,对于机器学习模型最重要的,就是理解单位数据本身。

就图像识别而言,模型为了正确识别狗,需要掌握的是每一张含有狗的图片数据中有何特征点,这些特征点与猫、与人、与桌椅板凳的特点有何不同,从而让图中的狗成为计算机眼中的狗

在这样的运算中,计算机是逻辑的主宰者。计算机在图片的特征参数提取中,学会了头圆、有深色鼻头、尖耳朵、可伸缩爪子的物体是猫,而吐舌头、塌耳朵、长脸的是狗。至于模型如何判断塌耳朵和尖耳朵,我们很难给出确切的答案。

在这里插入图片描述

我们最有控制权和控制可能性的,是通过奖励信号训练模型,让计算机在自己的推理逻辑下,给出我们想要的答案。
这就意味着,在机器学习中,我们需要一个更加灵活的东西,让机器可以为不同数据之间的联系赋予权重,而不仅仅只有指向。这就是运用向量的意义所在。

向量与矩阵

在机器学习算法中,有这样几个要素值得关注。

在这里插入图片描述

首先是数据集,它将作为输入信号(inputs),根据训练阶段的需求,被划分为模型的训练集、验证集、测试集。
其次就是向量。虽然在不同语境下,向量的意义各不相同,但并不妨碍我们将其归纳为含有数量级与方向的量。这样一来,向量便能搭载着数据的逻辑关系及权重,从而让数据集被输入编码器,形成数组,随之进入神经网络模型运算。

而这个庞大的数组,通常以矩阵的方式出现。
所谓矩阵(Matrix),当然不是《黑客帝国》里的那个邪恶智能体Matrix了,不过它的确有这方面的潜质。矩阵是一个按照长方阵列排列的复数或实数集合,它在计算模型中可以指代许多东西。

在这里插入图片描述

比如这个3 x 3的矩阵,其中的1可能指代的是物体颜色为红色,其中的5可能说的就是物体的位置。
而将矩阵放置在神经网络算法中,通常指代的是向量与数据集的组合。

为什么要利用矩阵呢?首先,大家都知道,单个向量本身就是一个1 x n的矩阵。其次,在Python中,Numpy系统可以直接进行矩阵之间运算。这样一来,便可以避免使用不断将单位数据代回公式的for循环,从而提升运算效率。

如何读懂?

理解了向量与矩阵的重要性,只是迈出了读懂机器学习的第一步,要继续走下去,必然需要夯实基础
在许多机器学习入门教程中,许多作者都提供了他们所认可的线性代数课程。

一位网名叫@SEFDstuff的小哥就在他的YouTube频道里提供了几个关于向量和矩阵的公开课链
向量 (explained with Linear Algebra):
https://www.khanacademy.org/math/linear-algebra/vectors-and-spaces
向量 (explained with PreCal):
https://www.khanacademy.org/math/precalculus/vectors-precalc
矩阵:
https://www.khanacademy.org/math/precalculus/precalc-matrices
不用翻墙,手指动一动,迈出你读懂机器学习的第一步吧!

读懂机器学习,需要建立自己的词典

入门机器学习并非难事,更不需要从零开始。

掌握Python固然重要,但Python不过也只是机器学习这本海量词典中的一个部分,而剩下的绝大多数内容,还有待发掘。

而发掘的过程,就是学习他人研究和代码过程。利用诸如TensorFlow,PyTorch这样的机器学习框架,开启学习的第一步将是一个很好的选择。

要知道,只有当你真正开始着手写作神经网络模型,你才能真正地发现问题,并获得寻找解决方案的动力。你的机器学习词典,才不会永远都停留在肤浅的层面。

参考文献链接:
https://www.leiphone.com/news/201804/wmYdmBLjATQZoH7c.html?viewType=weixin

本文转载自:百家号“读芯数”

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值