【CCF-CSP】202403-4 词频统计

最新推荐文章于 2024-07-25 21:13:04 发布

eihh23333

最新推荐文章于 2024-07-25 21:13:04 发布

阅读量393

点赞数 7

分类专栏： csp 文章标签：算法数据结构

本文链接：https://blog.csdn.net/eihh23333/article/details/138975562

版权

csp 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

题目描述

在学习了文本处理后，小 P 对英语书中的 𝑛n 篇文章进行了初步整理。具体来说，小 P 将所有的英文单词都转化为了整数编号。假设这 𝑛n 篇文章中共出现了 𝑚m 个不同的单词，则把它们从 11 到 𝑚m 进行编号。这样，每篇文章就简化为了一个整数序列，其中每个数都在 11 到 𝑚m 范围内。

现给出小 P 处理后的 𝑛n 篇文章，对于每个单词 𝑖i（1≤𝑖≤𝑚1≤i≤m），试统计：

单词 𝑖i 出现在了多少篇文章中？
单词 𝑖i 在全部文章中总共出现了几次？

输入格式

从标准输入读入数据。

输入共 𝑛+1n+1 行。

输入的第一行包含两个正整数 𝑛n 和 𝑚m，分别表示文章篇数和单词编号上限。

输入的第 𝑖+1i+1 行（1≤𝑖≤𝑛1≤i≤n）包含由空格分隔的若干整数，其中第一个整数 𝑙𝑖li 表示第 𝑖i 篇文章的长度（单词个数）；接下来 𝑙𝑖li 个整数表示对应的整数序列，序列中每个整数均在 11 到 𝑚m 范围内，各对应原文中的一个单词。

题解：

#include<bits/stdc++.h>
#define int long long
#define up(l,r,i) for(int i=l,END##i=r;i<=END##i;++i)
#define dn(r,l,i) for(int i=r,END##i=l;i>=END##i;--i)
using namespace std;
#define IOS ios::sync_with_stdio("false");cin.tie(0);cout.tie(0);
#define freopen freopen("IN.in","r",stdin);freopen("OUT.out","w",stdout);
typedef pair<int,int> PII;
const int N=1e5+10;
const int INF=0x7ffffff;
signed main(){
    IOS
    int m,n;
    cin>>n>>m;
    vector<int> tot_v(m+1,0);
    vector<int> tot_s(m+1,0);
    while(n--){
        int len;
        vector<bool> seen(m+1,false);
        cin>>len;
        for(int i=0;i<len;i++){
            int x;
            cin>>x;
            if(!seen[x]){
                seen[x]=true;
                tot_s[x]++;
            }
            tot_v[x]++;
        }
    }
    for(int i=1;i<=m;i++){
        cout<<tot_s[i]<<" "<<tot_v[i]<<endl;
    }
    return 0;
}

Hash。

签到题

eihh23333

关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【CCF-CSP】202403-4 词频统计

假设这 𝑛n 篇文章中共出现了 𝑚m 个不同的单词，则把它们从 11 到 𝑚m 进行编号。这样，每篇文章就简化为了一个整数序列，其中每个数都在 11 到 𝑚m 范围内。输入的第 𝑖+1i+1 行（1≤𝑖≤𝑛1≤i≤n）包含由空格分隔的若干整数，其中第一个整数 𝑙𝑖li 表示第 𝑖i 篇文章的长度（单词个数）；接下来 𝑙𝑖li 个整数表示对应的整数序列，序列中每个整数均在 11 到 𝑚m 范围内，各对应原文中的一个单词。输入的第一行包含两个正整数 𝑛n 和 𝑚m，分别表示文章篇数和单词编号上限。
复制链接

扫一扫