Hash Table,Hash Map是怎么来的?

原教程地址:https://www.youtube.com/watch?v=KyUTuwz_b7Q

Introduction

问题引入

在一个名字数组找名字Ada,需要遍历整个数组,复杂度 O(n)
如果我们知道Ada的索引,就可以 O(1) 直接找到Ada。
能不能构建一个函数,输入一个名字,输出得到索引?
这样要是查找一个名字,我们就可以直接算出索引,根本就不需要遍历!
在这里插入图片描述

尝试解决

我们采取这样的办法:

  • 把每个名字的每个字母的ASCII码值加起来,得到一个数值
  • 把这个数值对数组长度取模,得到一个index
  • 把这个名字放到这个数组对应的index位置上
    在这里插入图片描述

这样不管你要找什么名字,我直接通过计算就能知道它在哪里。搜索的时间复杂度是O(1)
如果数组里存的是键值对,就类似于我们日常用的哈希表了。显然这里是把一个字符串当成了key。

Hashing Algotithm

把一个key映射到一个内存地址的算法。

  • 对于整数类型的key,可以直接通过把key的值对可用地址的数目n进行取模。
  • 对于字符串类的key,可以把每个字符的ASCII码之和对n取模。
  • 还有一类 Folding Method,把key分成等量的部分,把每个部分计算的值加起来对n取模,比如把电话号码12345678拆成 12 34 56 78。

Collision Resolution

显然有一个问题上面没有提及,如果有多个key计算出来的地址是一样的怎么办??
显然,要存的东西越多,可用的内存地址越少,越容易出现这种情况。我们用一个指标来衡量这种情况的严重性:
L o a d F a c t o r = 要 存 的 东 西 的 总 数 可 用 内 存 的 数 量 Load Factor = \frac{要存的东西的总数}{可用内存的数量} LoadFactor=西
L o a d F a c t o r Load Factor LoadFactor越大,越容易出现冲突。
为了解决这个问题,出现了两类解法:

Open Addressing

叫Open是因为此类方法,每个内存地址对所有的要存的内容是开放的。也就是说,即使我发生冲突了,我可以存到别的地址上。

  • Linear Probing
    如果我发现计算得到的内容地址上已经有值了,我就去找下一个地址,直到找到空地址就存。查找时如果计算出的地址上不是我要的key,我就往下找直到找到我的key。这种方法最差的情况还是会遍历整个数组。
  • Plus 3 Rehash
    每次出现冲突,不停地找后面第三个地址有没有空位。
  • Quadratic Probing
    出现冲突,往后找失败次数的平方个位置。
  • Double Hashing
    出现冲突时,使用Second Hashing Function,得到该key下一次查找的步长。

Closed Addressing

叫Closed是因为此类方法,每个内存地址只对能通过哈希函数得到该地址的key开放。即使我发生冲突了,我也不能去占用别的地址。

  • Chaining Method
    每个数组的位置指向一个链表的头部。出现冲突时,在此处链表的尾部加上要存的内容即可。
    在这里插入图片描述

Design Hash Functions

  • 尽可能减少冲突
  • 使要存的内容尽量均匀分布在可用内存上
  • 哈希函数要尽量容易计算
  • 要能够处理冲突问题
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在风能领域,准确预测风速对于风电场的运行与管理至关重要。Matlab作为一个强大的数学计算和数据分析平台,被广泛应用于风速预测模型的构建。本文将深入探讨基于四种风速——随机风、基本风、阵风和渐变风的组合风速预测技术。 我们来理解这四种风速类型: 1. **随机风**:随机风是指风速呈现出随机性的变化,通常由大气湍流引起。在建模中,通常通过统计方法如高斯分布或Weibull分布来模拟这种不确定性。 2. **基本风**:基本风速是指在无特定扰动条件下的平均风速,它是长期观测结果的平均值,通常用于结构设计和风能评估。 3. **阵风**:阵风是短时间内风速显著增强的现象,对建筑物和风力发电机造成的主要威胁之一。阵风的预测涉及到风的脉动特性分析。 4. **渐变风**:渐变风是指风速随时间和空间逐渐变化的过程,常见于风向转变或地形影响下的风场变化。 在Matlab中,利用这四种风速类型进行组合预测,可以提高预测的准确性。预测模型可能包括以下几个步骤: 1. **数据收集与预处理**:收集历史风速数据,包括随机风、基本风、阵风和渐变风的数据,进行异常值检测、缺失值填充以及数据标准化。 2. **特征工程**:提取风速变化的相关特征,如平均值、标准差、极值、频率分布等,这些特征可能对预测有重要影响。 3. **模型选择**:可以选择多种预测模型,如时间序列分析(ARIMA、状态空间模型等)、机器学习算法(线性回归、决策树、支持向量机、神经网络等)或深度学习模型(LSTM、GRU等)。 4. **模型训练**:利用历史数据训练选定的模型,调整模型参数以优化性能,例如通过交叉验证来避免过拟合。 5. **模型验证与评估**:使用独立的测试集验证模型预测效果,常见的评估指标有均方误差(MSE)、平均绝对误差(MAE)和决定系数(R²)。 6. **组合预测**:结合四种风速的不同模型预测结果,可以采用加权平均、集成学习(如bagging、boosting)等方式,以提升整体预测精度。 7. **实时更新与动态调整**:实际应用中,模型需要不断接收新的风速数据并进行在线更新,以适应风场环境的变化。 通过以上步骤,可以构建一个综合考虑各种风速特性的预测系统,这对于风电场的功率输出预测、风电设备的维护计划以及电网调度都具有重要价值。然而,需要注意的是,每个风场的地理环境、气候条件和设备状况都有所不同,因此模型的建立应根据实际情况进行定制和优
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值