算法基本名词解释

最新推荐文章于 2020-12-28 22:13:05 发布

翱翔的江鸟

最新推荐文章于 2020-12-28 22:13:05 发布

阅读量5.1k

点赞数

分类专栏：机器学习笔记算法文章标签：算法基础名词

本文链接：https://blog.csdn.net/wxfghy/article/details/80271087

版权

这篇博客详细解释了数据科学中的几个基础概念，包括欧氏距离、曼哈顿距离、高斯分布、泊松分布和伯努利分布。此外，还探讨了信息论中的信息量、信息熵、香农公式以及向量、维度、矩阵内积等线性代数概念在大数据和机器学习中的应用。通过实例和代码展示了这些概念的计算和理解方法。

摘要由CSDN通过智能技术生成

《白话大数据与机器学习》笔记

1. 欧氏距离

欧氏距离
适用环境:
用于描述两个多维点之间的距离
Python实现代码

def euclidean(a1, a2):
    #a1,a2表示两个向量,每个向量有多个维度
    distance = 0  # 欧几里得距离
    for item in a1:  # item表示被评分物品
        if item in a2:  # 判断item是否同时在a1和a2中，即是否同时被两个用户评价过
            score1 = a1[item]  # score代表分数
            score2 = a2[item]
            distance += pow((score1 - score2), 2)
            distance = pow(distance, 0.5)
    return distance

2. 曼哈顿距离

曼哈顿距离
适用环境:
用于描述两个多维点之间的距离,比欧氏距离计算更加方便且消除开方后取近视值带来的误差
Python实现代码

def manhattan

最低0.47元/天解锁文章

翱翔的江鸟

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
算法基本名词解释

欧氏距离适用环境: 用于描述两个多维点之间的距离曼哈顿距离适用环境: 用于描述两个多维点之间的距离,比欧氏距离计算更加方便且消除开方后取近视值带来的误差高斯分布(正态分布) 参数说明: 1. exp是e^的意思,即e的指数,e约等于2.72 2. 极值为x=μ时,y=1/(√(2π)σ) 3. μ越大,函数曲线中轴越偏右 4. σ越大,函数曲线坡度越平...
复制链接

扫一扫

专栏目录