2023年四川大学生程序设计竞赛-B.希卡之石题解

最新推荐文章于 2024-07-14 18:15:43 发布

Hunter&

最新推荐文章于 2024-07-14 18:15:43 发布

阅读量316

点赞数 1

文章标签：算法 c++ c语言数据结构

本文链接：https://blog.csdn.net/qq_62899367/article/details/131872388

版权

题目描述

希卡之石包含了日志记录的功能，主要通过日志文件的形式存储。

日志文件是用于记录系统操作事件的记录文件或文件集合，可分为事件日志和消息日志。具有处理历史数据、诊断问题的追踪以及理解系统的活动等重要作用。日志文件应用广泛，在 linux、Windows 操作系统以及各大应用程序中均有涉及。本题正是参考 python 语言的 logging 日志的中诸多格式而展开的。具体来说，在 python 中 logging 会生成一个多行的日志文件；其中的每行均为一条日志。每条日志往往又由以下几个元素组成：

%(name)s：logger 的名字；

%(levelno)s：日志级别数值；

%(levelname)s：日志级别名称；

%(pathname)s：当前执行程序的路径；

%(filename)s：当前执行程序名；

%(lineno)d：日志的当前行号；

%(asctime)s：日志的时间；

%(thread)d：线程 ID；

%(threadName)s：线程名称；

%(process)s：进程 ID；

%(message)s：日志信息；需要注意以下几点：

首先，上述元素各自在一条日志中最多仅出现一次；其次，上述元素中的某一项或者某几项可能没有在一条日志中出现；最后，除了%(message)s——也即日志信息——一定会出现在一条日志结尾以外，其他所有元素的顺序是不定的。

另外，除了上述元素之外，一条日志中也可能出现上述元素外部的空格，日志可能会用一个或多个空格把上述元素分隔开。特别地，由于已经使用文中最末冒号作为日志信息这一元素的分隔与标识，所以并不在这一元素之前设置额外的空格来进行分隔。

下面给出适用于本题的、每个日志元素的格式定义以及出现情况定义：

%(name)s：

logger，也即日志器的名字，其基本格式为：logger : [a − z_A − Z]+（不含空格）；例如：logger : root。

%(levelno)s：

日志级别数值与下文所述日志级别名称一一对应，仅仅会出现五种数字，分别是 10,20,30,40,50。它们分别与 DEBUG，INFO，WARNING，ERROR，CRITICAL 对应。

%(levelname)s：

python.logging日志文件的日志级别名称元素仅仅会出现以下五种字样： DEBUG：用来打印调试信息，级别最低； INFO：用来打印一些正常操作信息；

WARNING：用来打印警告； ERROR：用来打印错误； CRITICAL：用来打印一些致命错误信息，等级最高。

%(pathname)s：

完整的路径名称的基本格式为：[A − Z] : (/[A − Za − z_0 − 9][A − Za − z_0 − 9 ]∗) + .[a − z]+(注意正则表达式中的空格：文件名与文件夹名允许空格, 但保证不会以空格开头)；

例如：C : /Program Files/AMD/atikmdag_dce.log。

%(filename)s：

执行程序名的基本格式为：[A − Za− z_0 − 9][A − Za − z_0 − 9 ] ∗ .[a − z]+(注意正则表达式中的空格：文件名允许空格, 但保证不会以空格开头)；

例如：atikmdag_dce.log；

当一条日志同时出现路径名和执行程序名的时候，保证执行程序名恰是路径名的末段（如 C:/pyth.py 与

pyth.py 的关系）

需要注意的是，题目保证：在数据中，符合日志级别名称与日志级别数值格式的字串不会成为执行程序名的前缀。

%(lineno)d：

日志的当前行号的基本格式为：line : [1 − 9][0 − 9]∗；

简单地说，这一项由固定字样 line : 与其后的一个非零且无前导零整数组成，例如 line : 111。

%(asctime)s：

日志的时间的基本格式为：[0 − 9]{4} −[0 − 9]{2} −[0 − 9]{2} [0 − 9]{2} : [0 − 9]{2} : [0 − 9]{2}, [0 − 9]{3}(注

意正则表达式中的空格, 在日期和时间之间)；

例如：1926 − 08 − 17 01 : 01 : 01, 111，其中逗号后面的整数表示毫秒。当然这样粗略地定义可能会产生

一些不合理的时间数据，题目保证一年有 12 个月，一天有 24 小时，一小时有 60 分钟，一分钟有 60 秒。当然选手请无视时间数据的不合理之处。

%(thread)d：

线程 ID 的基本格式为：thread : [0 − 9]+；

简单地说，这一项由固定字样 thread : 与其后的一个可能有前导零的整数组成，例如 thread : 01。

%(threadName)s：

线程名称的基本格式为：thread : [a − z_A − Z] + [0 − 9]+，也即由前段固定的前缀，中段字母与后段数码两个部分组成的字串;

例如：thread : MaIn0123.

%(process)s：

进程 ID 的基本格式为：process : [0 − 9]+；

简单地说，这一项由固定字样 process : 与其后的一个可能有前导零的整数组成，例如 process : 01。

%(message)s：

日志信息这一项必然会出现在每一条日志中，且必然会出现在每条日志的末尾。此外日志信息这一项必定以一个“:” 开头，且其内部不包含 “:”。换言之一条日志中最后一个 “:” 后面跟随的全部内容必定为日志信息项。

现在Cuber QQ 希望你能读取多条日志，对每条日志分析其内容，输出其有哪些元素以及各元素的具体内容。

输入描述

输入多条日志，每条日志占一行，以回车隔开。数据保证输入的日志格式内容合乎题目描述。

输出描述

对每条日志输出多行：

第一行输出日志编号，从 1 号开始；

从第二行开始，按日志中出现顺序，每行输出一个此条日志中出现的元素；输出格式形如“< type, content >”；

也即用一个尖括号输出一个二元组，第一个项是此日志元素的类型，形如%(name)s；第二项是此元素出现在此日志中的具体内容。

样例：

输入：

logger:root 10 DEBUG C:/program File/a.log a.log line:1 1926-08-17 01:01:01,999 thread:1 thread:main01 process:11: maef aaoa9208834,.;'p[qaosdif2930 23i dfjariwe
输出：

1
<%(name)s,logger:root>
<%(levelno)s,10>
<%(levelname)s,DEBUG>
<%(pathname)s,C:/program File/a.log>
<%(filename)s,a.log>
<%(lineno)d,line:1>
<%(asctime)s,1926-08-17 01:01:01,999>
<%(thread)d,thread:1>
<%(threadName)s,thread:main01>
<%(process)s,process:11>
<%(message)s, maef aaoa9208834,.;'p[qa osdif2930 23idfjariwe>

输入：

logger:root 10 DEBUG C:/program File/a DEBUG a/logger .log logger .log line: 10 2023-05-17 23:51:00,999 thread:10 thread:DEBUG01 process:11:logger root
10 DEBUG C /program File/a DEBUG a/lo gger .log logger .log line 10 2023-05
-17 23 51 00,999 thread 10 thread DEB
UG01 process 11
输出：

1
<%(name)s,logger:root>
<%(levelno)s,10>
<%(levelname)s,DEBUG>
<%(pathname)s,C:/program File/a DEBUG a/logger .log>
<%(filename)s,logger .log>
<%(lineno)d,line:10>
<%(asctime)s,2023-05-17 23:51:00,999>
<%(thread)d,thread:10>
<%(threadName)s,thread:DEBUG01>
<%(process)s,process:11>
<%(message)s,logger root 10 DEBUG C /p rogram File/a DEBUG a/logger .log logg er .log line 10 2023-05-17 23 51 00,99
9 thread 10 thread DEBUG01 process 11>

思路：

这个题的题面比较的抽象，很长，打眼一看感觉很复杂，其实他的逻辑很简单，可能就是码量有点大。

这个题根据题目给出的正在表达式，一项一项匹配就可以，首先找到最后那个message的信息，在从前边剩下的里面每一个去匹配就行

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const string messages[11]={
"<%(name)s,","<%(levelno)s,","<%(levelname)s,",
"<%(pathname)s,","<%(filename)s,","<%(lineno)d,",
"<%(asctime)s,","<%(thread)d,","<%(threadName)s,",
"<%(process)s,","<%(message)s,"};
const string LevelNo[5]={"DEBUG","INFO","WARNING","ERROR","CRITICAL"};
string s;
void solve()
{
    int message = s.find_last_of(':');
    string messagess = s.substr(message,s.size() - 1);
    // cout << messages << endl;
    string str = s.substr(0,message);
    // cout << str;
    stringstream ss;
    ss << str;
    string ans;
    // cout << ss.str();
    while(ss >> ans){
        // cout << "测试：" << ans << endl;
        if(ans.size() > 7 && ans.substr(0,7) == "logger:"){
            // cout << "测试：" << ans << endl;
            cout << "<%(name)s," << ans << ">\n";
        }
        else if(ans.size() == 2 && ans == "10" || ans == "20" || ans == "30" || ans == "40" || ans == "50"){
            cout << "<%(levelno)s," << ans << ">\n";
        }
        else if(ans == LevelNo[0] || ans == LevelNo[1] || ans == LevelNo[2] || ans == LevelNo[3] || ans == LevelNo[4]){
            cout << "<%(levelname)s," << ans << ">\n";
        }
        else if(ans.size() >= 2 && ans[0] >= 'A' && ans[0] <= 'Z' && ans[1] == ':'){
            cout << "<%(pathname)s," << ans;
                            // cout << "测试： " << ans << " ";
            if(ans.find('.') != ans.npos){
                // cout << "测试： " << ans << " ";
                cout << ">\n";
                continue;
            }
            else{
                while(ss >> ans){
                    cout << " " << ans;
                    // cout << "测试： " << ans << " ";
                    if(ans.find('.') != ans.npos){
                        cout << ">\n";
                        break;
                    }
                }
            }
        }
        else if(ans.size() > 5 && ans.substr(0,5) == "line:"){
            cout << "<%(lineno)d," << ans << ">\n";
        }
        else if(ans.find('-') != ans.npos){
            cout << "<%(asctime)s," << ans << " ";
            ss >> ans;
            cout << ans << ">\n";
        }
        else if(ans.size() > 7 && ans.substr(0,7) == "thread:" && ans[7] >= '0' && ans[7] <= '9'){
            cout << "<%(thread)d," << ans << ">\n";
        }
        else if(ans.size() > 7 && ans.substr(0,7) == "thread:"){
            cout << "<%(threadName)s," << ans << ">\n";
        }
        else if(ans.size() > 8 && ans.substr(0,8) == "process:"){
            cout << "<%(process)s," << ans << ">\n";
        }
        else{
            cout << "<%(filename)s," << ans;
            if(ans.find('.') != ans.npos){
                cout << ">\n";
                continue;
            }
            else{
                while(ss >> ans){
                    if(ans.find('.') != ans.npos){
                        cout << " " << ans << ">\n";
                        break;
                    }
                    else cout << " " << ans;
                }
            }
        }
    }
    cout << "<%(message)s," << messagess.substr(1,messagess.size() - 1) << ">\n";
}
int main()
{
    
    for(int bh = 1;getline(cin,s);bh++){
        cout << bh << endl;
        solve();
    }
}

Hunter&

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2023年四川大学生程序设计竞赛-B.希卡之石题解

另外，除了上述元素之外，一条日志中也可能出现上述元素外部的空格，日志可能会用一个或多个空格把上述元素分隔开。最后，除了%(message)s——也即日志信息——一定会出现在一条日志结尾以外，其他所有元素的顺序是不定的。日志的时间的基本格式为：[0 − 9]{4} −[0 − 9]{2} −[0 − 9]{2} [0 − 9]{2} : [0 − 9]{2} : [0 − 9]{2}需要注意的是，题目保证：在数据中，符合日志级别名称与日志级别数值格式的字串不会成为执行程序名的前缀。
复制链接

扫一扫