数据分类处理（20200301）

最新推荐文章于 2023-05-01 13:55:25 发布

sweets421

最新推荐文章于 2023-05-01 13:55:25 发布

阅读量346

点赞数

文章标签： python

本文链接：https://blog.csdn.net/sweets421/article/details/104595487

版权

题目描述

信息社会，有海量的数据需要分析处理，比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。
采集输入大数据和分类规则，通过大数据分类处理程序，将大数据分类输出。

输入描述:
一组输入整数序列I和一组规则整数序列R，I和R序列的第一个整数为序列的个数（个数不包含第一个整数）；整数范围为0~0xFFFFFFFF，序列个数不限

输出描述:
从R中依次取出R，对I进行处理，找到满足条件的I<j>：
I<j>整数对应的数字需要连续包含R对应的数字。比如R为23，I<j>为231，那么I<j>包含了R，条件满足。
按R从小到大的顺序:
(1)先输出R；
(2)再输出满足条件的I<j>的个数；
(3)然后输出满足条件的I<j>在I序列中的位置索引(从0开始)；
(4)最后再输出I<j>。

附加条件:
(1)R需要从小到大排序。相同的R只需要输出索引小的以及满足条件的I<j>，索引大的需要过滤掉
(2)如果没有满足条件的I<j>，对应的R不用输出
(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)

序列I：
15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123（第一个15表明后续有15个整数）
序列R：
5,6,3,6,3,0（第一个5表明后续有5个整数）
输出：
30,3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786
说明：
30----后续有30个整数
3----从小到大排序，第一个R为0，但没有满足条件的I<j>，不输出0，而下一个R是3
6— 存在6个包含3的I<j>
0— 123所在的原序号为0
123— 123包含3，满足条件

示例1
输入
15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123
5 6 3 6 3 0
输出
30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786

题解：

思路：本题的题目描述有些复杂，不过从示例倒着往上看题目，思路还是比较明确的，我们来理一下
1、输入要求：R和I两个数组，第一个数字记录的都是之后数组内数字的个数
2、R数组处理：除R[0]外的数字去重排序（通过新数组RR来存储）
3、I数组处理：从R数组从读取值（结果数组中加上该值），I中的每个值都看是否包含R中的这个值，包含的话就将值和对应的index都记录到结果数组中
4、结果数组处理：最后将R数组的每个值及处理后的I值的总个数插入到结果数组中，并将总个数插入[0]位置

# coding=utf-8

I = [15, 123, 456, 786, 453, 46, 7, 5, 3, 665, 453456, 745, 456, 786, 453, 123]
R = [5, 6, 3, 6, 3, 0]

O = []
RR = []

# R数组处理
lenR = R[0]
R.remove(R[0])
while len(R) > 0:
    for i in range(lenR):
        if RR.count(R[0]) > 0:
            R.remove(R[0])
            continue
        else:
            RR.append(R[0])
            R.remove(R[0])
    RR.sort()
    print(RR)
    
    # I数组处理
    lenI = I[0]
    I.remove(I[0])
    for i in range(len(RR)):
        count = 0
        if RR[i] == 0:
            continue
        O.append(RR[i])
        idx = len(O)
        for j in range(len(I)):
            if str(I[j]).count(str(RR[i])) > 0:
                count += 1
                O.append(j)
                O.append(I[j])
        O.insert(idx, count)
    print(O)
O.insert(0, len(O))
print(O)

说明：
目前本King的代码能力只能按上述方式实现，后续有更好的方案，欢迎各位指点，也会不定期做修改~

sweets421

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据分类处理（20200301）

题目描述信息社会，有海量的数据需要分析处理，比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。采集输入大数据和分类规则，通过大数据分类处理程序，将大数据分类输出。输入描述:一组输入整数序列I和一组规则整数序列R，I和R序列的第一个整数为序列的个数（个数不包含第一个整数）；整数范围为0~0xFFFFFFFF，序列个数不限输出描述:从R中依次取出R&...
复制链接

扫一扫