LeetCode刷题——哈希表(python语言)
一、哈希表
1.1 哈希表的概念
哈希表,也叫散列表。其实可以很像python的字典,也就是键(key)值(Hash(key))对,最简单也最常用的哈希表就是索引与索引的值具有一定的对应关系,(哈希函数)也就是说,a[0]=3代表数组中元素0的个数为3,可以看到哈希表大部分都被用来统计数据。而a[i]=[i],对于跨度大的数据又会特别浪费内存,所以会有一系列的填充算法。也就是哈希函数的构造,通常有直接定地址法、除留余数法、平方取中法、基数转化法、数字分析法、折叠法、随机数法、乘积法、点积法等。
1.2 哈希冲突
即使出现了如此多的填充算法改进这一问题,但是仍然可能会存在冲突,比如一个key要填充到哈希表,但是该地方已经被占用,这种情况被称为哈希冲突。为了这种情况下有两种方案来解决这一问题。分别是开放地址法和链地址法。
开发地址法:指的是哈希表的空地址向处理冲突开放。比如key已经被用。可以尝试key+1.找其他的位置有很多方法,比如线性探测法,分别从1,2,3,…找。或者二次探测法,从1,-1,4,-4,…等,伪随机数序列,随机的位置。而链地址法,则是将哈希表的数组每一个元素当作表头,冲突的元素通过头插法或者尾插法都放在同一个元素的表头下。
二、刷题
2.1 存在重复元素
给你一个整数数组 nums 。如果任一值在数组中出现 至少两次 ,返回 true ;如果数组中每个元素互不相同,返回 false 。
示例 1:
输入:nums = [1,2,3,1]
输出:true
示例 2:
输入:nums = [1,2,3,4]
输出:false
示例 3:
输入:nums = [1,1,1,3,3,4,3,2,4,2]
输出:true
提示:
1 <= nums.length <= 105
-109 <= nums[i] <= 109
class Solution:
def containsDuplicate(self, nums: List[int]) -> bool:
map = dict()
for i in nums:
if i not in map:
map[i] = 1
else:
return True
return False
2.2 存在重复元素 II
给你一个整数数组 nums 和一个整数 k ,判断数组中是否存在两个 不同的索引 i 和 j ,满足 nums[i] == nums[j] 且 abs(i - j) <= k 。如果存在,返回 true ;否则,返回 false 。
示例 1:
输入:nums = [1,2,3,1], k = 3
输出:true
示例 2:
输入:nums = [1,0,1,1], k = 1
输出:true
示例 3:
输入:nums = [1,2,3,1,2,3], k = 2
输出:false
提示:
1 <= nums.length <= 105
-109 <= nums[i] <= 109
0 <= k <= 105
class Solution:
def containsNearbyDuplicate(self, nums: List[int], k: int) -> bool:
map = dict()
for i,num in enumerate(nums):
if num not in map:
map[num] = i
else:
if(abs(i-map[num])<=k):
return True
else:
map[num] = i
return False
2.3 宝石与石头
给你一个字符串 jewels 代表石头中宝石的类型,另有一个字符串 stones 代表你拥有的石头。 stones 中每个字符代表了一种你拥有的石头的类型,你想知道你拥有的石头中有多少是宝石。
字母区分大小写,因此 “a” 和 “A” 是不同类型的石头。
示例 1:
输入:jewels = “aA”, stones = “aAAbbbb”
输出:3
示例 2:
输入:jewels = “z”, stones = “ZZ”
输出:0
提示:
1 <= jewels.length, stones.length <= 50
jewels 和 stones 仅由英文字母组成
jewels 中的所有字符都是 唯一的
class Solution:
def numJewelsInStones(self, jewels: str, stones: str) -> int:
map = {s:1 for s in jewels}
sum = 0
for s in stones:
if(s in map):
sum += 1
else:
continue
return sum
class Solution:
def numJewelsInStones(self, jewels: str, stones: str) -> int:
sum = 0
for s in stones:
if(s in jewels):
sum += 1
else:
continue
return sum
2.4 有效的数独
请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。
数字 1-9 在每一行只能出现一次。
数字 1-9 在每一列只能出现一次。
数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。(请参考示例图)
注意:
一个有效的数独(部分已被填充)不一定是可解的。
只需要根据以上规则,验证已经填入的数字是否有效即可。
空白格用 ‘.’ 表示。
示例 1:
输入:board =
[[“5”,“3”,".",".",“7”,".",".",".","."]
,[“6”,".",".",“1”,“9”,“5”,".",".","."]
,[".",“9”,“8”,".",".",".",".",“6”,"."]
,[“8”,".",".",".",“6”,".",".",".",“3”]
,[“4”,".",".",“8”,".",“3”,".",".",“1”]
,[“7”,".",".",".",“2”,".",".",".",“6”]
,[".",“6”,".",".",".",".",“2”,“8”,"."]
,[".",".",".",“4”,“1”,“9”,".",".",“5”]
,[".",".",".",".",“8”,".",".",“7”,“9”]]
输出:true
示例 2:
输入:board =
[[“8”,“3”,".",".",“7”,".",".",".","."]
,[“6”,".",".",“1”,“9”,“5”,".",".","."]
,[".",“9”,“8”,".",".",".",".",“6”,"."]
,[“8”,".",".",".",“6”,".",".",".",“3”]
,[“4”,".",".",“8”,".",“3”,".",".",“1”]
,[“7”,".",".",".",“2”,".",".",".",“6”]
,[".",“6”,".",".",".",".",“2”,“8”,"."]
,[".",".",".",“4”,“1”,“9”,".",".",“5”]
,[".",".",".",".",“8”,".",".",“7”,“9”]]
输出:false
解释:除了第一行的第一个数字从 5 改为 8 以外,空格内其他数字均与 示例1 相同。 但由于位于左上角的 3x3 宫内有两个 8 存在, 因此这个数独是无效的。
提示:
board.length == 9
board[i].length == 9
board[i][j] 是一位数字(1-9)或者 ‘.’
class Solution:
def isValidSudoku(self, board: List[List[str]]) -> bool:
rows_map = [dict() for _ in range(9)]
cols_map = [dict() for _ in range(9)]
boxes_map = [dict() for _ in range(9)]
for i in range(9):
for j in range(9):
if(board[i][j]=='.'):
continue
else:
num = int(board[i][j])
boxes = (i // 3) * 3 + j // 3
rows_num = rows_map[i].get(num,0)
cols_num = cols_map[j].get(num,0)
boxes_num = boxes_map[boxes].get(num,0)
if(rows_num >0 or cols_num>0 or boxes_num >0):
return False
rows_map[i][num] = 1
cols_map[j][num] = 1
boxes_map[boxes][num] = 1
return True
2.5 子域名访问计数
网站域名 “discuss.leetcode.com” 由多个子域名组成。顶级域名为 “com” ,二级域名为 “leetcode.com” ,最低一级为 “discuss.leetcode.com” 。当访问域名 “discuss.leetcode.com” 时,同时也会隐式访问其父域名 “leetcode.com” 以及 “com” 。
计数配对域名 是遵循 “rep d1.d2.d3” 或 “rep d1.d2” 格式的一个域名表示,其中 rep 表示访问域名的次数,d1.d2.d3 为域名本身。
例如,“9001 discuss.leetcode.com” 就是一个 计数配对域名 ,表示 discuss.leetcode.com 被访问了 9001 次。
给你一个 计数配对域名 组成的数组 cpdomains ,解析得到输入中每个子域名对应的 计数配对域名 ,并以数组形式返回。可以按 任意顺序 返回答案。
示例 1:
输入:cpdomains = [“9001 discuss.leetcode.com”]
输出:[“9001 leetcode.com”,“9001 discuss.leetcode.com”,“9001 com”]
解释:例子中仅包含一个网站域名:“discuss.leetcode.com”。
按照前文描述,子域名 “leetcode.com” 和 “com” 都会被访问,所以它们都被访问了 9001 次。
示例 2:
输入:cpdomains = [“900 google.mail.com”, “50 yahoo.com”, “1 intel.mail.com”, “5 wiki.org”]
输出:[“901 mail.com”,“50 yahoo.com”,“900 google.mail.com”,“5 wiki.org”,“5 org”,“1 intel.mail.com”,“951 com”]
解释:按照前文描述,会访问 “google.mail.com” 900 次,“yahoo.com” 50 次,“intel.mail.com” 1 次,“wiki.org” 5 次。
而对于父域名,会访问 “mail.com” 900 + 1 = 901 次,“com” 900 + 50 + 1 = 951 次,和 “org” 5 次。
提示:
1 <= cpdomain.length <= 100
1 <= cpdomain[i].length <= 100
cpdomain[i] 会遵循 “repi d1i.d2i.d3i” 或 “repi d1i.d2i” 格式
repi 是范围 [1, 104] 内的一个整数
d1i、d2i 和 d3i 由小写英文字母组成
class Solution:
def subdomainVisits(self, cpdomains):
"""
:type cpdomains: List[str]
:rtype: List[str]
"""
dic = {}
for s in cpdomains:
count = int(s.split()[0]) #注意分割后是字符串,要转整形,不然加法会出错
host = s.split()[-1].split('.')
for i in range(len(host)):
temp = '.'.join(host[i:]) #拼接所有域名的可能组合
if temp in dic.keys():
dic[temp] += count #把域名做key,访问次数做value
else:
dic[temp] = count
res = []
for key in dic.keys():
res.append(str(dic[key]) + ' ' + key) #要转为字符串类型做+运算
return res