此总结所使用的文章来源为重庆大学的获奖论文。
首先我们看一下挑战赛一的题目描述:
HighTech是一家互联网高科技公司,有几百名员工,分属财务、人力资源和研发三个部门。公司正在全力研发一款重量级新产品,近期该产品临近发布,公司对内部发生的一切异常现象都非常敏感。为了维护公司的核心利益,确保新产品顺利发布,公司高层决定临时成立内部威胁情报分析小组,该小组将根据公司内部采集到的数据,分析并处置可能存在的各种安全威胁。在分析威胁情报过程中,数据的复杂性需要计算智能处理,但发现和处置安全威胁需要人的经验、认知和判断,可视分析技术能将计算智能与人类智慧紧密结合,是威胁情报人员高效分析和理解威胁情报数据的利器。假设您是威胁情报分析小组的成员,请您设计并实现一套可视分析解决方案,帮助该公司及时准确地找出可能存在的内部威胁情报。
然后再看给的数据,按日期一共给了一个月的数据。每日的数据内有5个csv文件,分别为checking.csv、email.csv、login.csv、tcplog.csv、weblog.csv。每个csv的数据内容按照文件名能了解是属于那个方面的数据,具体数据内容后面根据题目来分析。
接着看问题一:
挑战 1.1:分析公司内部员工所属部门及各部门人员组织结构,给出公司员工的组织结构图。
对数据集进行初步审查后,认为分析Hightech公司内部员工所属部门和人员组织结构,应当以email日志的主题分类为切入点。
(1)对数据进行预筛选和处理
首先,因为是分析公司内部员工的问题,所以需要对邮件中的无相关人员的邮件进行丢弃。所以第一步先筛选出hightech.co