今天是来到北京大学可视化发展前沿暑期学校的第四天,今天的内容主要分为两块,早上是同济大学曹楠教授为我们教授异常检测以及可视方面的一些内容;下午是参观北大实验室。
异常校测方面的知识,曹楠教授从本拉登之死开始讲述,网友在微博上发布了一则本拉登死了的消息,之后各大网站、各地区频频转载这条消息,最终大家都知道了这条消息。
为了分析这件事的pattern,相关学者将每一个微博用户绘制成一个圆点,圆点的大小表示微博用户的影响力,具有转载关系的两个微博用户之间用一条线进行链接。通过这种关系,最终发现这是一个拥有好几万粉丝的微博大V发的消息,这则消息发出去之后,通过他的粉丝群迅速传播扩散。
之后曹楠教授给我们传授怎么做一个好的可视化工作:
1, data和task的abstraction
——这一步需要理解你的data(用filter、cluster、MDS等方法对你的数据进行一个预处理)
——理解你的task
2, design
——根据你的数据情况和任务作出可视化设计
3, layout
——提出你的可视化布局框架
——利用算法解决你布局中遇到的问题
4, map
——利用点、线、面、体等可视元素展示你的设计</