第十二章 哈希表与字符串哈希

一、哈希表

1、什么是哈希表

在之前的文章中,我们学习过离散化的算法,但是我们之前学过的离散化算法需要先去排序,所以效率较低。但是今天我们所学的哈希表同样是为了解决离散化的问题,但是其时间复杂度只有O(1)依旧是空间换时间。

2、算法逻辑

(1)哈希函数

我们假设存在一个哈希函数(hash)。这个函数的作用就是将一个大范围的数字映射到一个小范围的数字中。这个哈希函数仅仅是听起来很高尚,其实就是取模运算。我们将一系列的数字和100取模,那么最终得到的映射值就都属于0到99的。所以哈希函数就是取模。但是这里有一个问题,101%100=1,1001%100=1。这两个数字映射到了同一个映射值,发生了冲突。那么我们如何解决这个冲突呢?

(2)冲突解决

在这里插入图片描述
如上图所示,我们创建一个数组,这个数组存储不同的映射值,然后每个映射值都连接了一个链表,这个链表存储的都是具有相同映射值的值,例子如图中所示。这样的话,我们可以先去寻找映射后的值,找到对应的链表,再去遍历链表,得到对应的原值。

3、算法模板

在这里插入图片描述

#include<iostream>
#include<cstring>
using namespace std;
const int N=1e5+3;
int h[N],e[N],ne[N],idx;

void insert(int x)
{
    int p=(x%N+N)%N;
    e[idx]=x;
    ne[idx]=h[p];
    h[p]=idx++;
}

bool quary(int x)
{
    int p=(x%N+N)%N;
    for(int i=h[p];i!=-1;i=ne[i])
    {
        if(e[i]==x)
        {
            return true;
        }
    }
    return false;
    
}

int main()
{
    memset(h,-1,sizeof(h));
    int n;
    cin>>n;
    while(n--)
    {
        string op;int x;
        cin>>op>>x;
        if(op=="I")
        {
            insert(x);
        }
        else
        {
            if(quary(x))puts("Yes");
            else puts("No");
        }
    }
    return 0;
}

二、字符串哈希

1、算法逻辑

在这里插入图片描述
转化成数字后,该数字可能过大,因此我们需要再对这些数字进行取模离散化。
在这里插入图片描述

我们通过转化,将不同的字符串转化成了一串数字,但是必定存在一种情况,即两个字符串不同,但是最终得到的结果是相同的,即发生了冲突。那么为了解决这个问题,众多人总结出了一种经验,当p取131,m取264 的时候,百分之99的概率不会重复。

2、算法用途

当我们知道各种前缀对应的数字后,我们可以迅速得到任意一段的子串对应的数字,即迅速得到一截子串。
在这里插入图片描述
想要得到BC这段子串,我们可以让AB段和BC段通过某种运算得到。
那么如何运算呢?
在这里插入图片描述
示意图如下图所示,但实际上a并不是和a对齐的,而是a和x对齐的。
在这里插入图片描述
此时就发生了错误,因此我们再计算子串的时候,要做的第一件事就是位数对齐

3、算法模板

在这里插入图片描述

#include<iostream>
using namespace std;
const int N=1e5+10;
typedef unsigned long long ull;
ull h[N],p[N];
char str[N];

ull get_hash(int l,int r)
{
    return h[r]-h[l-1]*p[r-l+1];//位数对齐
}

int main()
{
    int n,m,px=131;
    p[0]=1;
    scanf("%d%d%s",&n,&m,str+1);
    for(int i=1;i<=n;i++)
    {
        p[i]=p[i-1]*px;
        h[i]=h[i-1]*px+str[i];//利用了前缀和的思路
    }
    while(m--)
    {
        int l1,r1,l2,r2;
        scanf("%d %d %d %d",&l1,&r1,&l2,&r2);
        if(get_hash(l1,r1)==get_hash(l2,r2))puts("Yes");
        else puts("No");
    }
    return 0;
}

我们这里利用unsigned long long去存储的话,我们会发现,当数据溢出的时候会发生数据截断。此时,就相当于取模了。

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
好的,下面是一段Java代码实现: ```java import java.io.File; import java.io.FileNotFoundException; import java.util.Arrays; import java.util.HashMap; import java.util.Scanner; public class Billionaire { private String name; private String arriveDate; private String city; private double wealth; public Billionaire(String name, String arriveDate, String city, double wealth) { this.name = name; this.arriveDate = arriveDate; this.city = city; this.wealth = wealth; } public String getName() { return name; } public String getArriveDate() { return arriveDate; } public String getCity() { return city; } public double getWealth() { return wealth; } public static void main(String[] args) { // 从文件中读取亿万富翁信息 String filename = "billionaires.txt"; Billionaire[] billionaires = readBillionairesFromFile(filename); // 按照到达日期排序 Arrays.sort(billionaires, (a, b) -> a.getArriveDate().compareTo(b.getArriveDate())); // 计算每个城市每天的财富总和 HashMap<String, Double> cityWealthMap = new HashMap<>(); String prevDate = ""; for (Billionaire billionaire : billionaires) { String cityDateKey = billionaire.getArriveDate() + "-" + billionaire.getCity(); if (!cityWealthMap.containsKey(cityDateKey)) { cityWealthMap.put(cityDateKey, 0.0); } if (!prevDate.equals("")) { double wealthPerDay = billionaire.getWealth() / daysBetween(prevDate, billionaire.getArriveDate()); for (String dateKey : getDateKeysBetween(prevDate, billionaire.getArriveDate(), billionaire.getCity())) { cityWealthMap.put(dateKey, cityWealthMap.get(dateKey) + wealthPerDay); } } prevDate = billionaire.getArriveDate(); } // 输出每个城市每天的财富总和 for (String cityDateKey : cityWealthMap.keySet()) { System.out.println(cityDateKey + ": " + cityWealthMap.get(cityDateKey)); } // 输出按照到达日期排序后的亿万富翁列表 for (Billionaire billionaire : billionaires) { System.out.println(billionaire.getName() + ": " + billionaire.getArriveDate() + " " + billionaire.getCity() + " " + billionaire.getWealth()); } } // 从文件中读取亿万富翁信息 private static Billionaire[] readBillionairesFromFile(String filename) { try { Scanner scanner = new Scanner(new File(filename)); int n = scanner.nextInt(); scanner.nextLine(); // 读取换行符 Billionaire[] billionaires = new Billionaire[n]; for (int i = 0; i < n; i++) { String line = scanner.nextLine(); String[] parts = line.split(" "); billionaires[i] = new Billionaire(parts[0], parts[1], parts[2], Double.parseDouble(parts[3])); } scanner.close(); return billionaires; } catch (FileNotFoundException e) { e.printStackTrace(); return null; } } // 计算两个日期之间相差的天数 private static int daysBetween(String date1, String date2) { int year1 = Integer.parseInt(date1.substring(0, 4)); int month1 = Integer.parseInt(date1.substring(5, 7)); int day1 = Integer.parseInt(date1.substring(8, 10)); int year2 = Integer.parseInt(date2.substring(0, 4)); int month2 = Integer.parseInt(date2.substring(5, 7)); int day2 = Integer.parseInt(date2.substring(8, 10)); int days1 = getDaysFromYearStart(year1, month1, day1); int days2 = getDaysFromYearStart(year2, month2, day2); return Math.abs(days2 - days1); } // 计算某年某月某日是该年的第几天 private static int getDaysFromYearStart(int year, int month, int day) { int[] daysInMonth = {0, 31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}; int days = day; for (int i = 1; i < month; i++) { days += daysInMonth[i]; } if (month > 2 && isLeapYear(year)) { days++; } return days; } // 判断某年是否为闰年 private static boolean isLeapYear(int year) { return (year % 4 == 0 && year % 100 != 0) || year % 400 == 0; } // 获取两个日期之间的所有日期对应的哈希表键 private static String[] getDateKeysBetween(String date1, String date2, String city) { int year1 = Integer.parseInt(date1.substring(0, 4)); int month1 = Integer.parseInt(date1.substring(5, 7)); int day1 = Integer.parseInt(date1.substring(8, 10)); int year2 = Integer.parseInt(date2.substring(0, 4)); int month2 = Integer.parseInt(date2.substring(5, 7)); int day2 = Integer.parseInt(date2.substring(8, 10)); int days1 = getDaysFromYearStart(year1, month1, day1); int days2 = getDaysFromYearStart(year2, month2, day2); int diff = days2 - days1; String[] dateKeys = new String[diff + 1]; for (int i = 0; i <= diff; i++) { int currYear = year1; int currMonth = month1; int currDay = day1 + i; if (currDay > 31 && (currMonth == 1 || currMonth == 3 || currMonth == 5 || currMonth == 7 || currMonth == 8 || currMonth == 10 || currMonth == 12)) { currDay -= 31; currMonth++; } else if (currDay > 30 && (currMonth == 4 || currMonth == 6 || currMonth == 9 || currMonth == 11)) { currDay -= 30; currMonth++; } else if (currDay > 28 && currMonth == 2 && !isLeapYear(currYear)) { currDay -= 28; currMonth++; } else if (currDay > 29 && currMonth == 2 && isLeapYear(currYear)) { currDay -= 29; currMonth++; } if (currMonth > 12) { currMonth = 1; currYear++; } dateKeys[i] = String.format("%04d-%02d-%02d-%s", currYear, currMonth, currDay, city); } return dateKeys; } } ``` 请注意,上述代码只是一个示例,可能需要根据实际情况进行修改和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值