题目:
811.子域名访问计数
一个网站域名,如"discuss.leetcode.com",包含了多个子域名。作为顶级域名,常用的有"com",下一级则有"leetcode.com",最低的一级为"discuss.leetcode.com"。当我们访问域名"discuss.leetcode.com"时,也同时访问了其父域名"leetcode.com"以及顶级域名 "com"。
给定一个带访问次数和域名的组合,要求分别计算每个域名被访问的次数。其格式为访问次数+空格+地址,例如:"9001 discuss.leetcode.com"。
接下来会给出一组访问次数和域名组合的列表cpdomains
。要求解析出所有域名的访问次数,输出格式和输入格式相同,不限定先后顺序。
示例 1: 输入: ["9001 discuss.leetcode.com"] 输出: ["9001 discuss.leetcode.com", "9001 leetcode.com", "9001 com"] 说明: 例子中仅包含一个网站域名:"discuss.leetcode.com"。按照前文假设,子域名"leetcode.com"和"com"都会被访问,所以它们都被访问了9001次。
示例 2 输入: ["900 google.mail.com", "50 yahoo.com", "1 intel.mail.com", "5 wiki.org"] 输出: ["901 mail.com","50 yahoo.com","900 google.mail.com","5 wiki.org","5 org","1 intel.mail.com","951 com"] 说明: 按照假设,会访问"google.mail.com" 900次,"yahoo.com" 50次,"intel.mail.com" 1次,"wiki.org" 5次。 而对于父域名,会访问"mail.com" 900+1 = 901次,"com" 900 + 50 + 1 = 951次,和 "org" 5 次。
注意事项:
-
cpdomains
的长度小于100
。 - 每个域名的长度小于
100
。 - 每个域名地址包含一个或两个"."符号。
- 输入中任意一个域名的访问次数都小于
10000
。
思路1
循环遍历,对于每一个域名,先把本身以及访问次数添加到字典中,如果存在子域名,则吧子域名也添加到字典中,最后把后缀的访问次数也添加到字典中。
这个需要一个判断,如果字典中不存在特定的键值,我们就把这个域名当做键,访问次数当做值,添加到字典中,如果存在这个域名的键,则需要把这个域名的访问次数和本身的已有的访问次数相加。如果使用传统的方法,就是需要一个判断,如果域名不存在键中,则字典增加一个值,如果存在,则值相加。这个逻辑很是麻烦。
简单的方法就是 :导入库 collections
cpdomains = ["900 google.mail.com", "50 yahoo.com", "1 intel.mail.com", "5 wiki.org"]
from collections import defaultdict
mydict = defaultdict(int)
#设置字典键的默认值 0 ,就不需要进行判断键值是否存在。
res =[]
for item in cpdomains:
#对于某一个域名访问次数添加进去
times,domains = item.split()
mydict[domains] += int(times)
#对于存在子域名的域名,把子域名添加进去
if domains.count(".") ==2:
mydict[domains[domains.index("."): ]] += int(times)
#对于所有的域名的后缀添加进去
List = domains.split(".")
mydict[List[-1]] += int(times)
#对于字典类型转化为列表类型
for key in mydict:
Str = str(mydict[key])+ " " + key
res.append(Str)
print(res)
思路2
from collections import defaultdict
domain_counts = defaultdict(int)
#设置字典键的默认值是 0
for cpdomain in cpdomains:
#把域名以及访问次数添加进去
times, domains = cpdomain.split()
times = int(times)
domain_counts[domains] += times
#遍历域名,把第一个点后面的字符当做子域名,同时更新子域名为新的域名,直到没有域名为止
while '.' in domains:
domains = domains[domains.index('.') + 1:]
domain_counts[domains] += times
print(domain_counts)
print( [str(v) + ' ' + d for d, v in domain_counts.items()])