数据说明:
数据为一家互联网高科技HighTech公司内部2017年11月共30天的多种监控数据,包括登录日志、页访问日志、邮件日志、打卡日志和TCP流量日志。数据以csv格式按天分类给出,总共120MB(未压缩之前)。各类型日志详细说明如下:
登录日志:
员工通过自己主机或跳板机的应用程序,登录服务器或数据库时生成的日志。例如使用SSH、SCP命令、XSHELL程序或者SFTP传输文件都会产生远程登录日志;客户端应用程序访问数据库时,会产生数据库登录日志。
网页访问日志:
该日志记录了公司内部所有员工的网页访问记录。time是该条记录生成时间,sip是客户端IP,sport是客户端端口,dip是服务器IP,dport是服务器端口,host是服务器域名。如果通过IP地址直接访问网站,不需要DNS服务器解析,则HTTP报头的host字段为空字符串。
TCPLOG日志:
记录公司内部网络活动产生的TCP连接。stime、dtime分别是连接建立和断开时间。proto是IP包头中的协议字段值。sip、dip分别是连接发起者和接受者的IP地址,sport、dport是与之对应的源与目的端口。整个连接过程中,sip向dip发送的总字节数为uplink_length,downlink_length与之相反。员工的登录行为、网页访问行行为、邮件发送或者接收行为等都会产生一条或者多条TCPLOG日志。
邮件日志:
邮件日志记录了经过公司邮件服务器的收发邮件信息。time是邮件的发送时间/接收时间,proto是邮件使用的应用协议。sip、dip分别是连接发起者和接受者的IP地址,sport、dport是与之对应的源与目的端口。from、to分别是邮件的发送者和接收者。邮件内容属于隐私,只提供邮件主题subject。
打卡日志:
记录了公司每个员工每天上下班时间,一行记录中checkin和checkout都为0,表示没来上班。那就是说,没有来公司打卡的员工,也会生成一行考勤记录。另外,如果公司员工当天没来公司上班,次日该员工会收到旷工提醒邮件。