《华为机试在线训练》之数据分类处理

时间限制:1秒 空间限制:32768K 热度指数:13649
本题知识点: 排序

题目描述

信息社会,有海量的数据需要分析处理,比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。  

采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。



输入描述:

一组输入整数序列I和一组规则整数序列RIR序列的第一个整数为序列的个数(个数不包含第一个整数);整数范围为0~0xFFFFFFFF,序列个数不限

输出描述:

R依次中取出R<i>,对I进行处理,找到满足条件的I<j> 

I<j>整数对应的数字需要连续包含R<i>对应的数字。比如R<i>23I<j>231,那么I<j>包含了R<i>,条件满足 。 

R<i>从小到大的顺序:

(1)先输出R<i> 

(2)再输出满足条件的I<j>的个数; 

(3)然后输出满足条件的I<j>I序列中的位置索引(0开始) 

(4)最后再输出I<j> 

附加条件: 

(1)R<i>需要从小到大排序。相同的R<i>只需要输出索引小的以及满足条件的I<j>,索引大的需要过滤掉 

(2)如果没有满足条件的I<j>,对应的R<i>不用输出 

(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)

 

序列I15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数) 

序列R5,6,3,6,3,0(第一个5表明后续有5个整数) 

输出:30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786

说明:

30----后续有30整数

3----从小到大排序,第一个R<i>为0,但没有满足条件的I<j>,不输出0,而下一个R<i>是3

6--- 存在6个包含3的I<j> 

0--- 123所在的原序号为0 

123--- 123包含3,满足条件 

示例1

输入

15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123
5 6 3 6 3 0

输出

30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786
       根据输出描述,将该题目处理过程分为三个部分,第一部分为输入数据,第二部分为排序和去重,第三部分为匹配处理,第四部分为结果输出。下面一一介绍:

一,输入数据

       题目中要求输入一组输入整数序列I和一组规则整数序列R,I和R序列的第一个整数位序列的个数,个数不包含第一个整数,整数范围为0~0xFFFFFFFF,序列个数不限制。

       这个时候是不是可以考虑使用vector容器,输入代码如下

      

        vector<int>A;
        vector<int>B;
        for(int i=0;i<m;++i)
            {
            int temp;
            cin>>temp;
            A.push_back(temp);
        }
        cin>>n;
        for(int i=0;i<n;++i)
            {
            int temp;
            cin>>temp;
            B.push_back(temp);
        }
        

        将要输入的数据压入容器中,每次都排在最后。

二,排序和去重处理

        这里排序就使用sort()进行处理,去重就使用unqiue()和erase()函数。代码如下:

   

        sort(B.begin(),B.end());  //排序
        B.erase(unique(B.begin(),B.end()),B.end());   //删除重复的元素
      

   在这里将一下sort()函数的用法,用于C++中,对给定区间所有元素进行排序。头文件是#include <algorithm>。sort函数见下表:

                                           

    

对数组进行排序,在c++中有库函数帮我们实现,这们就不需要我们自己来编程进行排序了。
(一)为什么要用c++标准库里的排序函数
Sort()函数是c++一种排序方法之一,学会了这种方法也打消我学习c++以来使用的冒泡排序和选择排序所带来的执行效率不高的问题!因为它使用的排序方法是类似于快排的方法,时间复杂度为n*log2(n),执行效率较高!
(二)c++标准库里的排序函数的使用方法
I)Sort函数包含在头文件为#include<algorithm>的c++标准库中,调用标准库里的排序方法可以不必知道其内部是如何实现的,只要出现我们想要的结果即可!
II)Sort函数有三个参数:
(1)第一个是要排序的数组的起始地址。
(2)第二个是结束的地址(最后一位要排序的地址)
(3)第三个参数是排序的方法,可以是从大到小也可是从小到大,还可以不写第三个参数,此时默认的排序方法是从小到大排序。
Sort函数使用模板:
Sort(start,end,排序方法)
下面就具体使用sort()函数结合对数组里的十个数进行排序做一个说明!
例子:sort函数没有第三个参数,实现的是从小到大
#include<iostream>
#include<algorithm>
using namespace std;
int main()
{
int a[10]={9,6,3,8,5,2,7,4,1,0};
for(int i=0;i<10;i++)
cout<<a[i]<<endl;
sort(a,a+10);
for(int i=0;i<10;i++)
cout<<a[i]<<endl;
return 0;
}

      unique是STL中很实用的函数之一,需要#include<iostream>,下面来简单介绍一下它的作用。unique的作用是“去掉”容器中相邻元素的重复元素,这里去掉要加一个引号,为什么呢,是因为它实质上是一个伪去除,它会把重复的元素添加到容器末尾,而返回值是去重之后的尾地址(是地址!!),举个例子:


     int num[10]={1,1,2,2,2,3,4,5,5,5};  
     int ans=unique(num,num+10)-num;  
          
这时,返回的ans是5,而num中前5项就是1,2,3,4,5,一般使用前需要对容器进行排序,这样才能实现对整个数组去重。
另:如果要对结构体进行这一操作,需要重载运算符"==",具体要根据自己需要重载。
      

       erase()函数的用法,erase()函数用于在顺序型容器中删除容器的一个元素,有两种函数原型,c.erase(p),c.erase(b,e);第一个删除迭代器p所指向的元素,第二个删除迭代器b,e所标记的范围内的元素,c为容器对象,返回值都是一个迭代器,该迭代器指向被删除元素后面的元素(这个是重点),具体的详细用法请参考其他资料。

三,匹配和处理

       这里写了一个匹配处理的子函数,用来匹配R序列中与I序列中相同的地方,代码如下:

        

bool or_match(int m,int n)
    {
    string str1=to_string(m);
    string str2=to_string(n);

    int pos = str2.find(str1);
    if(pos!=-1)
        return true;
    else
        return false;

}
       find()函数这里我就不介绍了,如果需要了解可以去翻看我之前的博客,链接如下:

http://blog.csdn.net/huangchijun11/article/details/77417430
匹配子函数的处理只是其中一小部分,真正地怎么将匹配后的结果放到对应的序列中,详细的处理过程如下:
    vector<int> index;
        vector<int> value;
        vector<int> cnt;
        vector<int> index1;
        for(unsigned int i=0;i<B.size();++i)
            {
            int num=0;
            for(unsigned int pos=0;pos<A.size();++pos)
				{
                if(or_match(B[i],A[pos]))
                    {
                    num++;
                    index.push_back(pos);//相应位置压入index
                    value.push_back(A[pos]);//把相应的值压入value中
                }
            }

            if(num!=0)
                {
                cnt.push_back(num);
                index1.push_back(i);
            }
        }

四,结果输出
这一部分只要注意一下输出的格式,基本上没有大问题,首先是要输出整个结果序列的个数,这一点要注意不将自己计入数量,根据测试用例可以看出输出的时候不是依次先将R序列全部输出,然后输出I序列,而是将R序列输出后,接着将对应的I序列产生的结果输出之后才继续输出下一个R序列中的数值,一个一个按顺序输出结果。代码如下:
int j=0;
        cout<<2*index.size()+index1.size()+cnt.size()<<' ';
        for(int i=0;i<cnt.size();++i)
            {
            cout<<B[index1[i]]<<' '<<cnt[i]<<' ';
            while(cnt[i]-->0)
                {
                cout<<index[j]<<' '<<value[j];
                if(i==cnt.size()-1&&cnt[i]==0)
                    {
                    cout<<endl;

                }
                else
                    {
                    cout<<' ';
                }
                j++;
            }
        }
五,最后完整代码如下所示:
#include <iostream>
#include <vector>
#include <algorithm>
#include <string>

using namespace std;

bool or_match(int m,int n)
    {
    string str1=to_string(m);
    string str2=to_string(n);

    int pos = str2.find(str1);
    if(pos!=-1)
        return true;
    else
        return false;

}

int main()
    {
    int m,n;
    while(cin>>m)
        {
        vector<int>A;
        vector<int>B;
        for(int i=0;i<m;++i)
            {
            int temp;
            cin>>temp;
            A.push_back(temp);
        }
        cin>>n;
        for(int i=0;i<n;++i)
            {
            int temp;
            cin>>temp;
            B.push_back(temp);
        }

        sort(B.begin(),B.end());  //排序
        B.erase(unique(B.begin(),B.end()),B.end());   //删除重复的元素

        vector<int> index;
        vector<int> value;
        vector<int> cnt;
        vector<int> index1;
        for(unsigned int i=0;i<B.size();++i)
            {
            int num=0;
            for(unsigned int pos=0;pos<A.size();++pos)
				{
                if(or_match(B[i],A[pos]))
                    {
                    num++;
                    index.push_back(pos);//相应位置压入index
                    value.push_back(A[pos]);//把相应的值压入value中
                }
            }

            if(num!=0)
                {
                cnt.push_back(num);
                index1.push_back(i);
            }
        }
        int j=0;
        cout<<2*index.size()+index1.size()+cnt.size()<<' ';
        for(int i=0;i<cnt.size();++i)
            {
            cout<<B[index1[i]]<<' '<<cnt[i]<<' ';
            while(cnt[i]-->0)
                {
                cout<<index[j]<<' '<<value[j];
                if(i==cnt.size()-1&&cnt[i]==0)
                    {
                    cout<<endl;

                }
                else
                    {
                    cout<<' ';
                }
                j++;
            }
        }

    }
    return 0;
}
        
最后感谢牛客网同学的指点,我是根据这位同学的代码学习之后总结的,链接如下:
       https://www.nowcoder.com/questionTerminal/9a763ed59c7243bd8ab706b2da52b7fd

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
华为OD数据分类是指根据特定规则将数据进行划分和分类的过程。数据分类数据处理和分析的基础,可以帮助我们更好地理解和利用数据。 首先,华为OD数据分类可以根据数据的类型进行分类数据类型包括数值型、字符型、日期型等。数值型数据可以进一步划分为整型和浮点型;字符型数据可以根据长度和字符集进行分类;日期型数据可以按照日期格式进行分类。 其次,数据还可以根据数据的属性和特征进行分类。例如,对于销售数据,可以按照产品、地区、时间等属性进行分类;对于用户数据,可以按照年龄、性别、职业等属性进行分类。这种分类可以帮助我们更好地识别和理解数据的特征。 此外,数据还可以根据数据的分布和关系进行分类。例如,可以将数据分为正态分布、偏态分布等;可以将数据分为相关性强、相关性弱等。这种分类可以帮助我们发现数据之间的关联和规律。 最后,数据还可以根据数据的重要性和优先级进行分类。通过对数据进行分类,可以将重要的数据和次要的数据进行区分,从而有针对性地进行数据处理和分析。 综上所述,华为OD数据分类包括根据数据类型、属性和特征、分布和关系以及重要性和优先级进行分类。这种分类能够帮助我们更好地理解和利用数据,为数据处理和分析提供基础支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值