算法基本名词解释

这篇博客详细解释了数据科学中的几个基础概念,包括欧氏距离、曼哈顿距离、高斯分布、泊松分布和伯努利分布。此外,还探讨了信息论中的信息量、信息熵、香农公式以及向量、维度、矩阵内积等线性代数概念在大数据和机器学习中的应用。通过实例和代码展示了这些概念的计算和理解方法。
摘要由CSDN通过智能技术生成

《白话大数据与机器学习》笔记

1. 欧氏距离

  1. 欧氏距离
    欧氏距离
  2. 适用环境:
    用于描述两个多维点之间的距离
  3. Python实现代码
def euclidean(a1, a2):
    #a1,a2表示两个向量,每个向量有多个维度
    distance = 0  # 欧几里得距离
    for item in a1:  # item表示被评分物品
        if item in a2:  # 判断item是否同时在a1和a2中,即是否同时被两个用户评价过
            score1 = a1[item]  # score代表分数
            score2 = a2[item]
            distance += pow((score1 - score2), 2)
            distance = pow(distance, 0.5)
    return distance

2. 曼哈顿距离

  1. 曼哈顿距离
    曼哈顿距离
  2. 适用环境:
    用于描述两个多维点之间的距离,比欧氏距离计算更加方便且消除开方后取近视值带来的误差
  3. Python实现代码
def manhattan
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值