首先,先对数据进行清洗,根据以下两个标准:
1.一张账户多次使用hackingteam的域名进行收发邮件。
2.若某个账户发送邮件数为0并且收发邮件数量小于500,则认为该员工为无效员工。
名称:Hacking team 人员关联关系拓扑图
类型:关联关系拓扑图
制作软件:Gephi
数据来源:经过数据清洗之后获得的员工名单以及他们之间的邮件往来
可分析数据:
A.点:代表有效的内部员工。
B.点的大小:代表该员工收发邮件数量的多少
C.线:代表员工之间的邮件往来
优点:将所有员工之间的邮件往来表现出来,并借此得到了邮件往来中比较重要的员工名单。
缺点:表示员工的点的颜色选取不太好,和线的颜色过于相似,对于可视化来说,表现不够清晰,而且拓扑图也被成为“毛线团”,对于普通用户来说这个图用来展示确实不太直观。
下面是她对公司员工的分类,采取了两种分类标准:
1.员在公司中的重要程度
2.该员工在公司中负责的业务
名称:人员重要程度可视化展示
类型:列状散点图
数据来源:有效成员列表,邮件往来情况以及邮件分类
可分析数据:
A.点:该员工的邮箱中某种类型邮件的数量占比。