题目描述
希卡之石包含了日志记录的功能,主要通过日志文件的形式存储。
日志文件是用于记录系统操作事件的记录文件或文件集合,可分为事件日志和消息日志。具有处理历史数据、诊断问题的追踪以及理解系统的活动等重要作用。日志文件应用广泛,在 linux、Windows 操作系统以及各大应用程序中均有涉及。本题正是参考 python 语言的 logging 日志的中诸多格式而展开的。具体来说,在 python 中 logging 会生成一个多行的日志文件;其中的每行均为一条日志。每条日志往往又由以下几个元素组成:
%(name)s:logger 的名字;
%(levelno)s:日志级别数值;
%(levelname)s:日志级别名称;
%(pathname)s:当前执行程序的路径;
%(filename)s:当前执行程序名;
%(lineno)d:日志的当前行号;
%(asctime)s:日志的时间;
%(thread)d:线程 ID;
%(threadName)s:线程名称;
%(process)s:进程 ID;
%(message)s:日志信息; 需要注意以下几点:
首先,上述元素各自在一条日志中最多仅出现一次;其次,上述元素中的某一项或者某几项可能没有在一 条日志中出现;最后,除了%(message)s——也即日志信息——一定会出现在一条日志结尾以外,其他所有元素的顺序是不定的。
另外,除了上述元素之外,一条日志中也可能出现上述元素外部的空格,日志可能会用一个或多个空格把 上述元素分隔开。特别地,由于已经使用文中最末冒号作为日志信息这一元素的分隔与标识,所以并不在 这一元素之前设置额外的空格来进行分隔。
下面给出适用于本题的、每个日志元素的格式定义以及出现情况定义:
%(name)s:
logger,也即日志器的名字,其基本格式为:logger : [a − z_A − Z]+(不含空格);例如:logger : root。
%(levelno)s:
日志级别数值与下文所述日志级别名称一一对应,仅仅会出现五种数字,分别是 10,20,30,40,50。它们分别与 DEBUG,INFO,WARNING,ERROR,CRITICAL 对应。
%(levelname)s:
python.logging日志文件的日志级别名称元素仅仅会出现以下五种字样: DEBUG:用来打印调试信息,级别最低; INFO:用来打印一些正常操作信息;
WARNING:用来打印警告; ERROR:用来打印错误; CRITICAL:用来打印一些致命错误信息,等级最高。
%(pathname)s:
完整的路径名称的基本格式为:[A − Z] : (/[A − Za − z_0 − 9][A − Za − z_0 − 9 ]∗) + .[a − z]+(注意正则表达式中的空格:文件名与文件夹名允许空格, 但保证不会以空格开头);
例如:C : /Program Files/AMD/atikmdag_dce.log。
%(filename)s:
执行程序名的基本格式为:[A − Za− z_0 − 9][A − Za − z_0 − 9 ] ∗ .[a − z]+(注意正则表达式中的空格: 文件名允许空格, 但保证不会以空格开头);
例如:atikmdag_dce.log;
当一条日志同时出现路径名和执行程序名的时候,保证执行程序名恰是路径名的末段(如 C:/pyth.py 与
pyth.py 的关系)
需要注意的是,题目保证:在数据中,符合日志级别名称与日志级别数值格式的字串不会成为执行程序名 的前缀。
%(lineno)d:
日志的当前行号的基本格式为:line : [1 − 9][0 − 9]∗;
简单地说,这一项由固定字样 line : 与其后的一个非零且无前导零整数组成,例如 line : 111。
%(asctime)s:
日志的时间的基本格式为:[0 − 9]{4} −[0 − 9]{2} −[0 − 9]{2} [0 − 9]{2} : [0 − 9]{2} : [0 − 9]{2}, [0 − 9]{3}(注
意正则表达式中的空格, 在日期和时间之间);
例如:1926 − 08 − 17 01 : 01 : 01, 111,其中逗号后面的整数表示毫秒。当然这样粗略地定义可能会产生
一些不合理的时间数据,题目保证一年有 12 个月,一天有 24 小时,一小时有 60 分钟,一分钟有 60 秒。当然选手请无视时间数据的不合理之处。
%(thread)d:
线程 ID 的基本格式为:thread : [0 − 9]+;
简单地说,这一项由固定字样 thread : 与其后的一个可能有前导零的整数组成,例如 thread : 01。
%(threadName)s:
线程名称的基本格式为:thread : [a − z_A − Z] + [0 − 9]+,也即由前段固定的前缀,中段字母与后段数码两个部分组成的字串;
例如:thread : MaIn0123.
%(process)s:
进程 ID 的基本格式为:process : [0 − 9]+;
简单地说,这一项由固定字样 process : 与其后的一个可能有前导零的整数组成,例如 process : 01。
%(message)s:
日志信息这一项必然会出现在每一条日志中,且必然会出现在每条日志的末尾。此外日志信息这一项必 定以一个“:” 开头,且其内部不包含 “:”。换言之一条日志中最后一个 “:” 后面跟随的全部内容必定为日志信息项。
现在Cuber QQ 希望你能读取多条日志,对每条日志分析其内容,输出其有哪些元素以及各元素的具体内容。
输入描述
输入多条日志,每条日志占一行,以回车隔开。数据保证输入的日志格式内容合乎题目描述。
输出描述
对每条日志输出多行:
第一行输出日志编号,从 1 号开始;
从第二行开始,按日志中出现顺序,每行输出一个此条日志中出现的元素; 输出格式形如“< type, content >”;
也即用一个尖括号输出一个二元组,第一个项是此日志元素的类型,形如%(name)s;第二项是此元素出 现在此日志中的具体内容。
样例:
输入:
logger:root 10 DEBUG C:/program File/a.log a.log line:1 1926-08-17 01:01:01,999 thread:1 thread:main01 process:11: maef aaoa9208834,.;'p[qaosdif2930 23i dfjariwe
输出:1
<%(name)s,logger:root>
<%(levelno)s,10>
<%(levelname)s,DEBUG>
<%(pathname)s,C:/program File/a.log>
<%(filename)s,a.log>
<%(lineno)d,line:1>
<%(asctime)s,1926-08-17 01:01:01,999>
<%(thread)d,thread:1>
<%(threadName)s,thread:main01>
<%(process)s,process:11>
<%(message)s, maef aaoa9208834,.;'p[qa osdif2930 23idfjariwe>
输入:
logger:root 10 DEBUG C:/program File/a DEBUG a/logger .log logger .log line: 10 2023-05-17 23:51:00,999 thread:10 thread:DEBUG01 process:11:logger root
10 DEBUG C /program File/a DEBUG a/lo gger .log logger .log line 10 2023-05
-17 23 51 00,999 thread 10 thread DEB
UG01 process 11
输出:1
<%(name)s,logger:root>
<%(levelno)s,10>
<%(levelname)s,DEBUG>
<%(pathname)s,C:/program File/a DEBUG a/logger .log>
<%(filename)s,logger .log>
<%(lineno)d,line:10>
<%(asctime)s,2023-05-17 23:51:00,999>
<%(thread)d,thread:10>
<%(threadName)s,thread:DEBUG01>
<%(process)s,process:11>
<%(message)s,logger root 10 DEBUG C /p rogram File/a DEBUG a/logger .log logg er .log line 10 2023-05-17 23 51 00,99
9 thread 10 thread DEBUG01 process 11>
思路:
这个题的题面比较的抽象,很长,打眼一看感觉很复杂,其实他的逻辑很简单,可能就是码量有点大。
这个题根据题目给出的正在表达式,一项一项匹配就可以,首先找到最后那个message的信息,在从前边剩下的里面每一个去匹配就行
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const string messages[11]={
"<%(name)s,","<%(levelno)s,","<%(levelname)s,",
"<%(pathname)s,","<%(filename)s,","<%(lineno)d,",
"<%(asctime)s,","<%(thread)d,","<%(threadName)s,",
"<%(process)s,","<%(message)s,"};
const string LevelNo[5]={"DEBUG","INFO","WARNING","ERROR","CRITICAL"};
string s;
void solve()
{
int message = s.find_last_of(':');
string messagess = s.substr(message,s.size() - 1);
// cout << messages << endl;
string str = s.substr(0,message);
// cout << str;
stringstream ss;
ss << str;
string ans;
// cout << ss.str();
while(ss >> ans){
// cout << "测试:" << ans << endl;
if(ans.size() > 7 && ans.substr(0,7) == "logger:"){
// cout << "测试:" << ans << endl;
cout << "<%(name)s," << ans << ">\n";
}
else if(ans.size() == 2 && ans == "10" || ans == "20" || ans == "30" || ans == "40" || ans == "50"){
cout << "<%(levelno)s," << ans << ">\n";
}
else if(ans == LevelNo[0] || ans == LevelNo[1] || ans == LevelNo[2] || ans == LevelNo[3] || ans == LevelNo[4]){
cout << "<%(levelname)s," << ans << ">\n";
}
else if(ans.size() >= 2 && ans[0] >= 'A' && ans[0] <= 'Z' && ans[1] == ':'){
cout << "<%(pathname)s," << ans;
// cout << "测试: " << ans << " ";
if(ans.find('.') != ans.npos){
// cout << "测试: " << ans << " ";
cout << ">\n";
continue;
}
else{
while(ss >> ans){
cout << " " << ans;
// cout << "测试: " << ans << " ";
if(ans.find('.') != ans.npos){
cout << ">\n";
break;
}
}
}
}
else if(ans.size() > 5 && ans.substr(0,5) == "line:"){
cout << "<%(lineno)d," << ans << ">\n";
}
else if(ans.find('-') != ans.npos){
cout << "<%(asctime)s," << ans << " ";
ss >> ans;
cout << ans << ">\n";
}
else if(ans.size() > 7 && ans.substr(0,7) == "thread:" && ans[7] >= '0' && ans[7] <= '9'){
cout << "<%(thread)d," << ans << ">\n";
}
else if(ans.size() > 7 && ans.substr(0,7) == "thread:"){
cout << "<%(threadName)s," << ans << ">\n";
}
else if(ans.size() > 8 && ans.substr(0,8) == "process:"){
cout << "<%(process)s," << ans << ">\n";
}
else{
cout << "<%(filename)s," << ans;
if(ans.find('.') != ans.npos){
cout << ">\n";
continue;
}
else{
while(ss >> ans){
if(ans.find('.') != ans.npos){
cout << " " << ans << ">\n";
break;
}
else cout << " " << ans;
}
}
}
}
cout << "<%(message)s," << messagess.substr(1,messagess.size() - 1) << ">\n";
}
int main()
{
for(int bh = 1;getline(cin,s);bh++){
cout << bh << endl;
solve();
}
}