大数据开发之机器学习总结(数学知识)(三)

本文是大数据开发中机器学习的数学知识总结,涵盖了向量、矩阵、概率和线性方程的基础概念。向量作为数据表示,其距离和相似度计算在算法中至关重要;矩阵提供了批量运算的便利;概率论涉及联合概率、条件概率和各种概率分布;线性方程则与变量间的一次方关系相关。这些基础知识在机器学习和人工智能领域广泛应用。
摘要由CSDN通过智能技术生成

大数据开发之机器学习总结(数学知识)(三)

背景

  1. 在大数据开发业务场景中,如果是对数据做聚合或者明细统计等,则使用大数据的框架结合逻辑代码即可。
  2. 如果需要有更高层级的需求,例如做数据预测或者分类,则需要使用机器学习的技术来处理了。
  3. 如果需要更进一步让算法模型可以自我学习提升,则需要用到人工智能的技术。
  4. 机器学习是一门涉及到知识点非常广泛的计算机学科,概率统计,线性代数,高等数学,各类编程语言下的算法框架等等。
  5. 在现有大数据处理框架下,spark和flink对机器学习都有做支持,但相对更成熟的是spark的mllib模块。如果公司技术团队有使用spark经验,则学习和使用成本会大幅降低,唯一需要补充的就是算法知识和API调用。

1. 机器学习基础数学知识

1.1. 向量

  1. 概念,简单来说,向量可以看成一串数字,不过每个数字都有自己的含义。如在这里插入图片描述
    这里可以看成是年龄,身高,退休年龄,工资。直接使用这样的形式表达含义。
    也可以结合多维空间坐标来理解向量,如(1,2,3)可以理解为x,y,z轴的坐标。当然实际开发时,往往不局限于3个坐标,往往是多个指标。就类似Kylin框架的多维立方体。
  2. 向量距离ÿ
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值