一、数据分类处理
描述
信息社会,有海量的数据需要分析处理,比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。
采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。
数据范围:1 \le I,R \le 100 \1≤I,R≤100 ,输入的整数大小满足 0 \le val \le 2^{31}-1\0≤val≤231−1
输入描述:
一组输入整数序列I和一组规则整数序列R,I和R序列的第一个整数为序列的个数(个数不包含第一个整数);整数范围为0~(2^31)-1,序列个数不限
输出描述:
从R依次中取出R<i>,对I进行处理,找到满足条件的I:
I整数对应的数字需要连续包含R<i>对应的数字。比如R<i>为23,I为231,那么I包含了R<i>,条件满足 。
按R<i>从小到大的顺序:
(1)先输出R<i>;
(2)再输出满足条件的I的个数;
(3)然后输出满足条件的I在I序列中的位置索引(从0开始);
(4)最后再输出I。
附加条件:
(1)R<i>需要从小到大排序。相同的R<i>只需要输出索引小的以及满足条件的I,索引大的需要过滤掉
(2)如果没有满足条件的I,对应的R<i>不用输出
(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)
序列I:15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数)
序列R:5,6,3,6,3,0(第一个5表明后续有5个整数)
输出:30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786
说明:
30----后续有30个整数
3----从小到大排序,第一个R<i>为0,但没有满足条件的I,不输出0,而下一个R<i>是3
6--- 存在6个包含3的I
0--- 123所在的原序号为0
123--- 123包含3,满足条件
示例1
输入:
15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123 5 6 3 6 3 0复制输出:
30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786复制说明:
将序列R:5,6,3,6,3,0(第一个5表明后续有5个整数)排序去重后,可得0,3,6。 序列I没有包含0的元素。 序列I中包含3的元素有:I[0]的值为123、I[3]的值为453、I[7]的值为3、I[9]的值为453456、I[13]的值为453、I[14]的值为123。 序列I中包含6的元素有:I[1]的值为456、I[2]的值为786、I[4]的值为46、I[8]的值为665、I[9]的值为453456、I[11]的值为456、I[12]的值为786。 最后按题目要求的格式进行输出即可。
思路:
此题主要考察输出。我首先将输入存在两个数组中,并都去除首项分别存入l和r数组中。之后将r去重并排序之后,遍历l,将包含r[i]的项的位置序号及值存入列表R_r,并同时计数,将r中每个值被l包含的次数存入另一个数组,最后按要求输出即可。
代码:
L = list(map(int,input().split()))
R = list(map(int,input().split()))
l = L[1:]
r = R[1:]
R_r = []
r = list(set(r))
r.sort()
m = []
for i in range(len(r)):
flag = 0
k = 0
for j in range(len(l)):
if str(r[i]) in str(l[j]):
flag = 1
R_r.append(j)
R_r.append(l[j])
k = k+1
if flag == 1:
m.append([r[i],k])
n = len(R_r) + (len(m)*2)
print(n,end=' ')
num = 0
for i in range(len(m)):
print(m[i][0],m[i][1],end=' ')
for j in range(m[i][1]*2):
print(R_r[num],end=' ')
num = num + 1
二、查找兄弟单词
描述
定义一个单词的“兄弟单词”为:交换该单词字母顺序(注:可以交换任意次),而不添加、删除、修改原有的字母就能生成的单词。
兄弟单词要求和原来的单词不同。例如: ab 和 ba 是兄弟单词。 ab 和 ab 则不是兄弟单词。
现在给定你 n 个单词,另外再给你一个单词 x ,让你寻找 x 的兄弟单词里,按字典序排列后的第 k 个单词是什么?
注意:字典中可能有重复单词。
数据范围:1 \le n \le 1000 \1≤n≤1000 ,输入的字符串长度满足 1 \le len(str) \le 10 \1≤len(str)≤10 , 1 \le k < n \1≤k<n
输入描述:
输入只有一行。 先输入字典中单词的个数n,再输入n个单词作为字典单词。 然后输入一个单词x 最后后输入一个整数k
输出描述:
第一行输出查找到x的兄弟单词的个数m 第二行输出查找到的按照字典顺序排序后的第k个兄弟单词,没有符合第k个的话则不用输出。
示例1
输入:
3 abc bca cab abc 1复制输出:
2 bca复制
示例2
输入:
6 cab ad abcd cba abc bca abc 1复制输出:
3 bca复制说明:
abc的兄弟单词有cab cba bca,所以输出3 经字典序排列后,变为bca cab cba,所以第1个字典序兄弟单词为bca
思路:
判断是否为兄弟单词:长度相等,所含字符种类相同,每个字符的出现次数相同。最后排序的时候要注意是多属性排序。
代码:
aa = list(map(str,input().split()))
a = int(aa[0]) #字典中单词个数
b = aa[1:1+a] #字典单词
k = int(aa[-1]) #整数k
c = aa[-2] #单词
cc = list(c)
m = 0 #兄弟单词的个数
w_k = [] #兄弟单词
for i in range(a):
flag = 0
if len(b[i]) == len(cc):
for j in range(len(cc)):
if cc[j] in b[i] and c.count(cc[j]) == b[i].count(cc[j]):
flag = 0
else:
flag = 1
break
else:
flag = 1
if flag == 0 and b[i] != c:
m = m + 1
w_k.append(b[i])
if len(c) == 1:
w_k = sorted(w_k,key=lambda x:x[0])
elif len(c) == 2:
w_k = sorted(w_k,key=lambda x:(x[0],x[1]))
elif len(c) == 3:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2]))
elif len(c) == 4:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3]))
elif len(c) == 5:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3],x[4]))
elif len(c) == 6:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3],x[4],x[5]))
elif len(c) == 7:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3],x[4],x[5],x[6]))
elif len(c) == 8:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3],x[4],x[5],x[6],x[7]))
elif len(c) == 9:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3],x[4],x[5],x[6],x[7],x[8]))
elif len(c) == 10:
w_k = sorted(w_k,key=lambda x:(x[0],x[1],x[2],x[3],x[4],x[5],x[6],x[7],x[8],x[9]))
w_k = sorted(w_k,key=lambda x:(x[0],x[1]))
print(m)
if len(w_k) >=k:
print(w_k[k-1])