《华为机试在线训练》之数据分类处理

最新推荐文章于 2023-06-12 15:13:56 发布

huangchijun11

最新推荐文章于 2023-06-12 15:13:56 发布

阅读量1.4k

点赞数

分类专栏： C++ 《华为机试在线训练之我见》文章标签：华为机试

本文链接：https://blog.csdn.net/huangchijun11/article/details/77478107

版权

C++ 同时被 2 个专栏收录

18 篇文章 1 订阅

订阅专栏

《华为机试在线训练之我见》

15 篇文章 4 订阅

订阅专栏

时间限制：1秒空间限制：32768K 热度指数：13649

本题知识点：排序

题目描述

信息社会，有海量的数据需要分析处理，比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。

采集输入大数据和分类规则，通过大数据分类处理程序，将大数据分类输出。

输入描述:

一组输入整数序列I和一组规则整数序列R，I和R序列的第一个整数为序列的个数（个数不包含第一个整数）；整数范围为0~0xFFFFFFFF，序列个数不限

输出描述:

从R依次中取出R<i>，对I进行处理，找到满足条件的I<j>： 
I<j>整数对应的数字需要连续包含R<i>对应的数字。比如R<i>为23，I<j>为231，那么I<j>包含了R<i>，条件满足 。 
按R<i>从小到大的顺序:
(1)先输出R<i>； 
(2)再输出满足条件的I<j>的个数； 
(3)然后输出满足条件的I<j>在I序列中的位置索引(从0开始)； 
(4)最后再输出I<j>。 
附加条件： 
(1)R<i>需要从小到大排序。相同的R<i>只需要输出索引小的以及满足条件的I<j>，索引大的需要过滤掉 
(2)如果没有满足条件的I<j>，对应的R<i>不用输出 
(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)
 
序列I：15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123（第一个15表明后续有15个整数） 
序列R：5,6,3,6,3,0（第一个5表明后续有5个整数） 
输出：30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786
说明：
30----后续有30个整数
3----从小到大排序，第一个R<i>为0，但没有满足条件的I<j>，不输出0，而下一个R<i>是3
6--- 存在6个包含3的I<j> 
0--- 123所在的原序号为0 
123--- 123包含3，满足条件

示例1

输入

15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123
5 6 3 6 3 0

输出

30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786

根据输出描述，将该题目处理过程分为三个部分，第一部分为输入数据，第二部分为排序和去重，第三部分为匹配处理，第四部分为结果输出。下面一一介绍：

一，输入数据

题目中要求输入一组输入整数序列I和一组规则整数序列R，I和R序列的第一个整数位序列的个数，个数不包含第一个整数，整数范围为0~0xFFFFFFFF,序列个数不限制。

这个时候是不是可以考虑使用vector容器，输入代码如下

        vector<int>A;
        vector<int>B;
        for(int i=0;i<m;++i)
            {
            int temp;
            cin>>temp;
            A.push_back(temp);
        }
        cin>>n;
        for(int i=0;i<n;++i)
            {
            int temp;
            cin>>temp;
            B.push_back(temp);
        }

将要输入的数据压入容器中，每次都排在最后。

二，排序和去重处理

这里排序就使用sort()进行处理，去重就使用unqiue()和erase()函数。代码如下：

        sort(B.begin(),B.end());  //排序
        B.erase(unique(B.begin(),B.end()),B.end());   //删除重复的元素

在这里将一下sort()函数的用法，用于C++中，对给定区间所有元素进行排序。头文件是#include <algorithm>。sort函数见下表：

对数组进行排序，在c++中有库函数帮我们实现，这们就不需要我们自己来编程进行排序了。

（一）为什么要用c++标准库里的排序函数

Sort（）函数是c++一种排序方法之一，学会了这种方法也打消我学习c++以来使用的冒泡排序和选择排序所带来的执行效率不高的问题！因为它使用的排序方法是类似于快排的方法，时间复杂度为n*log2(n)，执行效率较高！

（二）c++标准库里的排序函数的使用方法

I）Sort函数包含在头文件为#include<algorithm>的c++标准库中，调用标准库里的排序方法可以不必知道其内部是如何实现的，只要出现我们想要的结果即可！

II）Sort函数有三个参数：

（1）第一个是要排序的数组的起始地址。

（2）第二个是结束的地址（最后一位要排序的地址）

（3）第三个参数是排序的方法，可以是从大到小也可是从小到大，还可以不写第三个参数，此时默认的排序方法是从小到大排序。

Sort函数使用模板:

Sort(start,end,排序方法)

下面就具体使用sort（）函数结合对数组里的十个数进行排序做一个说明！

例子：sort函数没有第三个参数，实现的是从小到大

#include<iostream>
#include<algorithm>
using namespace std;
int main()
{
int a[10]={9,6,3,8,5,2,7,4,1,0};
for(int i=0;i<10;i++)
cout<<a[i]<<endl;
sort(a,a+10);
for(int i=0;i<10;i++)
cout<<a[i]<<endl;
return 0;
}

unique是STL中很实用的函数之一，需要#include<iostream>，下面来简单介绍一下它的作用。unique的作用是“去掉”容器中相邻元素的重复元素，这里去掉要加一个引号，为什么呢，是因为它实质上是一个伪去除，它会把重复的元素添加到容器末尾，而返回值是去重之后的尾地址（是地址！！），举个例子：

int num[10]={1,1,2,2,2,3,4,5,5,5};

int ans=unique(num,num+10)-num;

这时，返回的ans是5，而num中前5项就是1,2,3,4,5，一般使用前需要对容器进行排序，这样才能实现对整个数组去重。

另：如果要对结构体进行这一操作，需要重载运算符"=="，具体要根据自己需要重载。

erase()函数的用法，erase()函数用于在顺序型容器中删除容器的一个元素，有两种函数原型，c.erase(p),c.erase(b,e);第一个删除迭代器p所指向的元素，第二个删除迭代器b,e所标记的范围内的元素，c为容器对象，返回值都是一个迭代器，该迭代器指向被删除元素后面的元素（这个是重点），具体的详细用法请参考其他资料。

三，匹配和处理

这里写了一个匹配处理的子函数，用来匹配R序列中与I序列中相同的地方，代码如下：

bool or_match(int m,int n)
    {
    string str1=to_string(m);
    string str2=to_string(n);

    int pos = str2.find(str1);
    if(pos!=-1)
        return true;
    else
        return false;

}

find()函数这里我就不介绍了，如果需要了解可以去翻看我之前的博客，链接如下：

http://blog.csdn.net/huangchijun11/article/details/77417430

匹配子函数的处理只是其中一小部分，真正地怎么将匹配后的结果放到对应的序列中，详细的处理过程如下：

    vector<int> index;
        vector<int> value;
        vector<int> cnt;
        vector<int> index1;
        for(unsigned int i=0;i<B.size();++i)
            {
            int num=0;
            for(unsigned int pos=0;pos<A.size();++pos)
				{
                if(or_match(B[i],A[pos]))
                    {
                    num++;
                    index.push_back(pos);//相应位置压入index
                    value.push_back(A[pos]);//把相应的值压入value中
                }
            }

            if(num!=0)
                {
                cnt.push_back(num);
                index1.push_back(i);
            }
        }

四，结果输出

这一部分只要注意一下输出的格式，基本上没有大问题，首先是要输出整个结果序列的个数，这一点要注意不将自己计入数量，根据测试用例可以看出输出的时候不是依次先将R序列全部输出，然后输出I序列，而是将R序列输出后，接着将对应的I序列产生的结果输出之后才继续输出下一个R序列中的数值，一个一个按顺序输出结果。代码如下：

int j=0;
        cout<<2*index.size()+index1.size()+cnt.size()<<' ';
        for(int i=0;i<cnt.size();++i)
            {
            cout<<B[index1[i]]<<' '<<cnt[i]<<' ';
            while(cnt[i]-->0)
                {
                cout<<index[j]<<' '<<value[j];
                if(i==cnt.size()-1&&cnt[i]==0)
                    {
                    cout<<endl;

                }
                else
                    {
                    cout<<' ';
                }
                j++;
            }
        }

五，最后完整代码如下所示：

#include <iostream>
#include <vector>
#include <algorithm>
#include <string>

using namespace std;

bool or_match(int m,int n)
    {
    string str1=to_string(m);
    string str2=to_string(n);

    int pos = str2.find(str1);
    if(pos!=-1)
        return true;
    else
        return false;

}

int main()
    {
    int m,n;
    while(cin>>m)
        {
        vector<int>A;
        vector<int>B;
        for(int i=0;i<m;++i)
            {
            int temp;
            cin>>temp;
            A.push_back(temp);
        }
        cin>>n;
        for(int i=0;i<n;++i)
            {
            int temp;
            cin>>temp;
            B.push_back(temp);
        }

        sort(B.begin(),B.end());  //排序
        B.erase(unique(B.begin(),B.end()),B.end());   //删除重复的元素

        vector<int> index;
        vector<int> value;
        vector<int> cnt;
        vector<int> index1;
        for(unsigned int i=0;i<B.size();++i)
            {
            int num=0;
            for(unsigned int pos=0;pos<A.size();++pos)
				{
                if(or_match(B[i],A[pos]))
                    {
                    num++;
                    index.push_back(pos);//相应位置压入index
                    value.push_back(A[pos]);//把相应的值压入value中
                }
            }

            if(num!=0)
                {
                cnt.push_back(num);
                index1.push_back(i);
            }
        }
        int j=0;
        cout<<2*index.size()+index1.size()+cnt.size()<<' ';
        for(int i=0;i<cnt.size();++i)
            {
            cout<<B[index1[i]]<<' '<<cnt[i]<<' ';
            while(cnt[i]-->0)
                {
                cout<<index[j]<<' '<<value[j];
                if(i==cnt.size()-1&&cnt[i]==0)
                    {
                    cout<<endl;

                }
                else
                    {
                    cout<<' ';
                }
                j++;
            }
        }

    }
    return 0;
}

最后感谢牛客网同学的指点，我是根据这位同学的代码学习之后总结的，链接如下：
https://www.nowcoder.com/questionTerminal/9a763ed59c7243bd8ab706b2da52b7fd

huangchijun11

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《华为机试在线训练》之数据分类处理

时间限制：1秒空间限制：32768K 热度指数：13649本题知识点：排序题目描述信息社会，有海量的数据需要分析处理，比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。采集输入大数据和分类规则，通过大数据分类处理程序，将大数据分类输出。输入描述:一组输入整数序列I和一组规则整数序列R，I和R序列的第一个整
复制链接

扫一扫