数据分类处理(20200301)

题目描述

信息社会,有海量的数据需要分析处理,比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。
采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。

输入描述:
一组输入整数序列I和一组规则整数序列R,I和R序列的第一个整数为序列的个数(个数不包含第一个整数);整数范围为0~0xFFFFFFFF,序列个数不限

输出描述:
从R中依次取出R<i>,对I进行处理,找到满足条件的I<j>:
I<j>整数对应的数字需要连续包含R<i>对应的数字。比如R<i>为23,I<j>为231,那么I<j>包含了R<i>,条件满足 。
按R<i>从小到大的顺序:
(1)先输出R<i>;
(2)再输出满足条件的I<j>的个数;
(3)然后输出满足条件的I<j>在I序列中的位置索引(从0开始);
(4)最后再输出I<j>。

附加条件:
(1)R<i>需要从小到大排序。相同的R<i>只需要输出索引小的以及满足条件的I<j>,索引大的需要过滤掉
(2)如果没有满足条件的I<j>,对应的R<i>不用输出
(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)

序列I:
15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数)
序列R:
5,6,3,6,3,0(第一个5表明后续有5个整数)
输出:
30,3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786
说明:
30----后续有30个整数
3----从小到大排序,第一个R<i>为0,但没有满足条件的I<j>,不输出0,而下一个R<i>是3
6— 存在6个包含3的I<j>
0— 123所在的原序号为0
123— 123包含3,满足条件

示例1
输入
15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123
5 6 3 6 3 0
输出
30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786

题解:

思路:本题的题目描述有些复杂,不过从示例倒着往上看题目,思路还是比较明确的,我们来理一下
1、输入要求:R和I两个数组,第一个数字记录的都是之后数组内数字的个数
2、R数组处理:除R[0]外的数字去重排序(通过新数组RR来存储)
3、I数组处理:从R数组从读取值(结果数组中加上该值),I中的每个值都看是否包含R中的这个值,包含的话就将值和对应的index都记录到结果数组中
4、结果数组处理:最后将R数组的每个值及处理后的I值的总个数插入到结果数组中,并将总个数插入[0]位置

# coding=utf-8

I = [15, 123, 456, 786, 453, 46, 7, 5, 3, 665, 453456, 745, 456, 786, 453, 123]
R = [5, 6, 3, 6, 3, 0]

O = []
RR = []

# R数组处理
lenR = R[0]
R.remove(R[0])
while len(R) > 0:
    for i in range(lenR):
        if RR.count(R[0]) > 0:
            R.remove(R[0])
            continue
        else:
            RR.append(R[0])
            R.remove(R[0])
    RR.sort()
    print(RR)
    
    # I数组处理
    lenI = I[0]
    I.remove(I[0])
    for i in range(len(RR)):
        count = 0
        if RR[i] == 0:
            continue
        O.append(RR[i])
        idx = len(O)
        for j in range(len(I)):
            if str(I[j]).count(str(RR[i])) > 0:
                count += 1
                O.append(j)
                O.append(I[j])
        O.insert(idx, count)
    print(O)
O.insert(0, len(O))
print(O)

说明:
目前本King的代码能力只能按上述方式实现,后续有更好的方案,欢迎各位指点,也会不定期做修改~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据分类处理是指根据一定的规则或特征将数据进行划分和归类的过程。在python中,可以利用各种数据分类处理的方法和库来完成这一任务。 首先,我们可以使用pandas库来加载和处理数据。通过pandas中的DataFrame数据结构,我们可以将数据加载到内存中,并进行各种操作和转换。 其次,根据数据的特征和目标,可以选择不同的分类处理方法。例如,如果需要对数据进行离散化处理,可以使用pandas的cut()函数或numpy库中的digitize()函数;如果需要对数据进行分组,可以使用pandas的groupby()函数;如果需要对数据进行筛选和过滤,可以使用pandas的Boolean indexing方法等等。这些方法都可以根据特定的条件或规则对数据进行分类处理。 此外,如果需要对数据进行机器学习或深度学习的分类处理,可以使用scikit-learn或tensorflow等机器学习库。这些库提供了丰富的分类算法和模型,可以根据数据的特征和目标进行训练和预测。 最后,在进行数据分类处理时,需要注意数据的质量和准确性。可以使用pandas进行数据清洗和预处理,例如处理缺失值、异常值、重复值等。同时,也要考虑到不同数据类型的处理方法和技巧,如文本数据、时间序列数据、图像数据等。 总之,数据分类处理数据分析和机器学习领域中重要的一环。在python中,通过使用相应的库和方法,我们可以方便地对数据进行分类处理,从而提取出有价值的信息和模式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值