【刷题笔记】第五天

最新推荐文章于 2024-07-26 00:30:42 发布

progressiveFighting

最新推荐文章于 2024-07-26 00:30:42 发布

阅读量1k

点赞数 17

分类专栏：刷题笔记文章标签：笔记哈希算法算法

本文链接：https://blog.csdn.net/computs/article/details/137758613

版权

刷题笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章介绍了三种实现哈希集合的方法：纯数组、数组+链表以及位运算，同时涉及大整数加法和DNA序列的迭代加深搜索，强调了不同实现策略和剪枝优化的重要性。

摘要由CSDN通过智能技术生成

文章目录

[705. 设计哈希集合](https://leetcode.cn/problems/design-hashset/)
[A + B Problem II ](https://vjudge.net.cn/problem/HDU-1002)
[DNA sequence](https://vjudge.net.cn/problem/HDU-1560#author=GPT_zh)

705. 设计哈希集合

实现一：纯数组实现

由于key最大为 $10^6$ ，所以开辟一个 $10^6+1$ 长度的布尔数组，来判断key是否存在。

class MyHashSet {
    private static int MAX = (int)1e6 + 1;
    public boolean[] flag;
    public MyHashSet() {
        flag = new boolean[MAX];
    }
    
    public void add(int key) {
        flag[key] = true;
    }
    
    public void remove(int key) {
        flag[key] = false;
    }
    
    public boolean contains(int key) {
        return flag[key];
    }
}

实现二：数组+链表

java中的HshSet的实现原理：

使用HashMap当作数组，其中元素存放在key中。

当添加元素key时，首先计算key在数组中的位置，计算过程如下：

int hash = (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
return hash & (数组长度 - 1)

如果key是空，直接返回0
否则，key的哈希值与右移后的哈希值做异或，结果就是key的新哈希值
然后将新哈希值与长度-1做与，结果就是key在数组中的位置。

添加元素key的流程：
首先计算出key对应的索引index；
如果index位置没有元素，直接放入；否则判断链表里有没有重复元素，若有，则直接返回；
否则将key插入到链表里。

我们仿照这个来实现

class MyHashSet {
    static class Node {
        int val;
        Node next;
        public Node(int val) {
            this.val = val;
        }
    }
    // 为了便于计算索引的位置，将数组长度定为2的整数次方 (int)Math.pow(2, 14);
    // 这个数组的长度可以很小
	private static final int N = (int)Math.pow(2, 14);
    Node[] table = new Node[N];

    public MyHashSet() {
        //table = new Node[N];
    }

    // 获取key在哈希表中的索引
    private int getIndex(Integer key) {
        // 为了让 key 对应的 hash 高位也参与运算，这里对 hashCode 进行无符号右移异或
    	// 如果hash小于等于2^16 - 1(65535)，则无符号右移后变为0
        // 通过将高16位与低16位异或，从而使得 hashCode 的高位随机性和低位随机性都能体现在低 16 位中
        int hashCode = Integer.hashCode(key);
        hashCode ^= (hashCode >>> 16);
        return (N - 1) & hashCode;
    }
    
    public void add(int key) {
        int index = getIndex(key);
        if (table[index] == null) {
            // index位置没元素，直接放
            table[index] = new Node(key);
        } else {
            // index位置有元素了，把key插入到table[index]链表里
            // 在插入之前，先判断链表里是否存在key
            Node pre = null;
            Node cur = table[index];
            while (cur != null) {
                if (cur.val == key) {
                    // key重复了，添加失败
                    return;
                }
                pre = cur;
                cur = cur.next;
            }
            // 此时pre是链表的尾节点
            // 两种插入方式（头插法，尾插法），这里使用尾插法
            Node node = new Node(key);
            pre.next = node;
        }

    }
    
    public void remove(int key) {
        int index = getIndex(key);
        Node cur = table[index];
        if (cur != null) {
            Node pre = null;
            while (cur != null) {
                if (cur.val == key) {
                    if (pre == null) {
                        // 删除链表的头节点
                        table[index] = cur.next;
                    } else {
                        // 删除链表的中间节点
                        pre.next = cur.next;
                    }
                    return;
                }
                pre = cur;
                cur = cur.next;   
            }
        }
    }
    
    public boolean contains(int key) {
        int index = getIndex(key);
        Node cur = table[index];
        while (cur != null) {
            if (cur.val == key) {
                return true;
            }
            cur = cur.next;
        }
        return false;
    }
}

实现三：位运算

int类型有32位，可以表示32个数，那么31250个int，可以表示1000000个数(0~999999)，所以数组长度定为31251

每一个int代表一个块，一共312501个块，每一块里能代表32个数

那如何找到key对应的块呢？
通过key / 32操作

如何找到key在块中的索引呢？
通过key % 32，更高效的做法是key & 31(31的二进制是5个1)

初始时，数组元素置为0，表示一个元素也没有

添加元素：将对应块的位置为1

移除元素：将对应块的位置为0

class MyHashSet {

    // int类型有32位，可以表示32个数，那么31250个int，可以表示1000000个数(0~999999)
    // 所以数组长度定为31251
    public int[] table = new int[31251];

    public MyHashSet() {

    }
    
    public void add(int key) {
        int index = key >> 5; // 相当于除以32
        int bitIndex = key & 31; // 相当于key % 32
        table[index] |= (1 << bitIndex); // 将table[index]的bitIndex位置1
    }
    
    public void remove(int key) {
        int index = key >> 5; // 相当于除以32 (块索引)
        int bitIndex = key & 31; // 相当于key % 32 (位索引)
        table[index] &= (~(1 << bitIndex)); // 将table[index]的bitIndex位置0
    }
    
    public boolean contains(int key) {
        int index = key >> 5; // 相当于除以32
        int bitIndex = key & 31; // 相当于key % 32
        return ((table[index] >> bitIndex) & 1) == 1;
    }
}

A + B Problem II

手动实现大整数加

import java.util.Scanner;

public class Main{
	public static String add(String a, String b) {
		String res = "";
		int i = a.length() - 1;
		int j = b.length() - 1;
		int c = 0; // 进位
		while (i >= 0 || j >= 0 || c > 0) {
            // 从低位到高位，一位一位的算
			char aChar = i >=0 ? a.charAt(i) : '0';
			char bChar = j >= 0 ? b.charAt(j) : '0';
			int ans = 0;
			ans += c;
			ans += aChar - '0' + bChar - '0';
			c = ans / 10;
			res = String.valueOf(ans % 10) + res;
			i--;
			j--;
		}	
		return res;
	}
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		Scanner sc = new Scanner(System.in);
		int t = sc.nextInt();
		for (int i = 0; i < t; ++i) {
			String a = sc.next();
			String b = sc.next();
			String ans = add(a, b);
			System.out.println("Case " + String.valueOf(i + 1) + ":");
			System.out.println(a + " + " + b + " = " + ans);
			System.out.println();
		}
	}
}

DNA sequence

迭代加深搜索

目标字符串的长度是未知的，所以应该从所有序列的最大长度开始搜索

通过剪枝限制递归的深度

剪枝策略：如果已经匹配的字符个数+最长待匹配字符数 > 目标字符串的长度，则直接返回false，表示之前的匹配方案无效。

对于最长待匹配字符数，有两种计算方法：

方法一：统计所有序列中最长的待匹配字符数

int ans = 0;
for(int i = 1; i <= n; ++i) {
    ans = max(len[i] - pos[i] + 1, ans); //最大待匹配长度 
return ans;

方法二：统计所有序列的待匹配部分中A出现的最多次数+C出现的最多次数+G出现的最多次数+T出现的最多次数，并返回

int ans = 0;
// 计算A，C，G，T最多出现次数的累加和
for (int i = 1; i <= 4; ++i) {
	int maxCnt = 0;
	// 计算dic[i]最多出现次数
	for (int j = 1; j <= n; ++j) {
		// 计算s[j]中 dic[i] 出现的次数
		int t = 0;
		for (int k = pos[j]; k <= len[j]; ++k) {
			t += s[j][k] == dic[i] ? 1 : 0;
		}
		maxCnt = max(maxCnt, t);
	}
	ans += maxCnt;
}

return ans;

显然方法二剪枝策略更高效

#include<iostream>
#include<cmath>
#include<algorithm>
#include<vector>
using namespace std;
const int MAX_N = 10, MAX_L = 10;

char s[MAX_N][MAX_L]; // s[i]:表示第i个序列
int pos[MAX_N]; // pos[i]: 表示第i个序列的第一个待匹配位置
int len[MAX_N]; // len[i]：表示第i个序列的长度
int n, t, res;

char dic[5] = { 0, 'A', 'C', 'G', 'T' };

int wrong() {
	int ans = 0;
	// 计算A，C，G，T最多出现次数的累加和
	for (int i = 1; i <= 4; ++i) {
		int maxCnt = 0;
		// 计算dic[i]最多出现次数
		for (int j = 1; j <= n; ++j) {
			// 计算s[j]中 dic[i] 出现的次数
			int t = 0;
			for (int k = pos[j]; k <= len[j]; ++k) {
				t += s[j][k] == dic[i] ? 1 : 0;
			}
			maxCnt = max(maxCnt, t);
		}
		ans += maxCnt;
	}

	return ans;
}

// dep表示已经匹配的字符数
bool dfs(int dep) {
	
	int temp = wrong();
	if (temp == 0) {
		// 待匹配字符数为0
		return true;
	}

	if (dep + temp > res) {
		// dep + temp 大于序列长度，说明之前的匹配方案无效
		return false;
	}
	vector<int> v;
	for (int i = 1; i <= 4; ++i) {
		for (int j = 1; j <= n; ++j) {
			if (s[j][pos[j]] == dic[i]) {
				// s[j]序列成功匹配到一个字符
				pos[j]++;
				v.push_back(j); // 记录一下，再结束递归时，再恢复现场
			}
		}

		if (v.size() > 0) {
			// 有序列成功匹配到，才进行递归
			// 继续匹配
			if (dfs(dep + 1)) {
				return true;
			}
			else {
				// 恢复现场
				while (v.size() > 0) {
					int tail = v[v.size() - 1];
					v.pop_back();
					pos[tail]--;
				}
			}
		}
	}
	return false;
}

int main() {
	scanf("%d", &t);
	while (t--) {
		scanf("%d", &n);
		res = 0;
		for (int i = 1; i <= n; ++i) {
			memset(s[i], '\0', sizeof(s[i]));
			scanf("%s", s[i] + 1);
			pos[i] = 1;
			len[i] = strlen(s[i] + 1);
			//printf("s[i]=%s, len[i]=%d\n", s[i], len[i]);
			res = max(res, len[i]);
		}
		while (!dfs(0)) {
			res++;
		}
		printf("%d\n", res);
	}
	return 0;
}