C++学习13-求解海量数据的问题

最新推荐文章于 2022-04-27 13:19:14 发布

Bubblegirl123

最新推荐文章于 2022-04-27 13:19:14 发布

阅读量270

点赞数 1

分类专栏： C++ 文章标签：数据结构算法 c++

本文链接：https://blog.csdn.net/sunshine612/article/details/105008749

版权

求解海量数据

统计英文单词出现的次数，并按照出现的顺序打印单词和它的次数
通过快排的分割，来求解海量数据top k的问题
海量数据的前n大/前n小/Top k问题
用小根堆求出前五最大数据并输出
找第一个重复的数字
统计数字及其出现的次数可以使用无序映射表
对内存有限制的大数据处理

在这里插入图片描述

统计英文单词出现的次数，并按照出现的顺序打印单词和它的次数

int main()
{
   
    string strArr[] =
    {
   "hello", "sfdf", "rtyui", "vbn", "hello", "sfdf"};
    // 统计上面的英文单词出现的次数，并按照出现的顺序打印单词和它的次数
    vector<string> vec;
    unordered_map<string, int> map;
    for (string &str : strArr)
    {
   
        map[str]++;//用map记单词以及单次次数，紧接着传入vector 输出vector中的单词
        vec.push_back(str);
    }


    for (string &str : vec)
    {
   
        auto it = map.find(str);
        if (it != map.end())
        {
   
            cout << str << " " << map[str] << endl;
            map.erase(str);//如果不查出来删掉会出现打两遍的结果 hello....hello..
        }
    }


    return 0;
}

通过快排的分割，来求解海量数据top k的问题

如何通过快排的分割，来求解海量数据top k的问题
10000 值最大的前10个 / 值最大的第10个

/*

*/
template<typename T>
int partation(vector<T> &arr, int i, int j)
{
   
    int val = arr[i];
    while (i < j)
    {
   
        while (i < j && arr[j] > val)
        {
   
            j--;
        }
        if (i < j)
        {
   
            arr[i++] = arr[j];
        }
        while (i < j && arr[i] < val)
        {
   
            i++;
        }
        if (i < j)
        {
   
            arr[j--] = arr[i];
        }
    }
    arr[i] = val;
    return i;
}
// 2,3,6,5,8,0,3,1,9,10


template<typename T>
int selectValue01(vector<T> &vec, int i, int j, int k)
{
   
    int pos = partation(vec, i, j);
    if (pos == k - 1)
    {
   
        return pos;
    }
    else if (pos < k - 1)
    {
   //如果找到的位置是小于k的 说明得从右边再找 所以变动i下标
        return selectValue01(vec, pos + 1, j, k);
    }
    else
    {
   
        return selectValue01(vec, i, pos - 1, k);
    }
}
int main()
{
   
    vector<int> vec;
    for (int i = 0; i < 20; ++i)
    {
   
        vec.push_back(rand() % 100);
    }
    // 求vec容器中，值第5小和值第8大的元素，打印出来
    for (int data : vec)
    {
   


        cout << data << " "

最低0.47元/天解锁文章

Bubblegirl123

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
C++学习13-求解海量数据的问题

求解海量数据统计英文单词出现的次数，并按照出现的顺序打印单词和它的次数通过快排的分割，来求解海量数据top k的问题海量数据的前n大/前n小/Top k问题用小根堆求出前五最大数据并输出找第一个重复的数字统计数字及其出现的次数可以使用无序映射表对内存有限制的大数据处理统计英文单词出现的次数，并按照出现的顺序打印单词和它的次数int main(){ string strArr[] =...
复制链接

扫一扫