数据分类与挖掘几个问题

 

1从UCI学习库中取得一个数据集,并尽可能的多使用本章介绍的不同的可视化技术。文献注释和本书网站提供了可视化软件的线索。

2至少指出使用颜色可视化提供信息的两个优点和缺点。

优点:颜色使视觉元素更容易可视化识别。举例:如果区分者将二维数据点中的三个簇用不同颜色标识,则更容易辨别。当然,数字使用颜色看起来也更有趣。

缺点:一些人是色盲将不方便区分带有颜色的数字。灰色字体的数字在某些情况下会展示更多的细节。颜色使用起来不容易,比如,一个糟糕的配色方案可以是花哨的,也可以把注意力集中在不重要的元素上。

3关于三维图形,安排问题是什么?

4.讨论使用抽样来减少需要显示的数据对象个数的优缺点。简单随机抽样(无放回)是一种好的抽样方法码?为什么?

Simple random sampling is not the best approach since it will eliminate most

of the points in sparse regions. It is better to undersample the regions where

data objects are too dense while keeping most or all of the data objects from

sparse regions.

5.如何创建可视表示来显示描述如下系统的信息。

(a)计算机网络。确保包括网络的静态信息(如连接性)和动态性质(如通信量)

(b)在特定时间,特定的植物和动物种类在全世界的分布。

(c)对于一组基准数据库程序,计算机资源(如处理时间、内存和磁盘)的使用情况。

(d)过去30年内,一个特定国家的工人职业变化。假定提供了每个人每年的信息,这提供了性别和文化程度。

确保处理了一下问题。

  1. 表示。如何将对象、属性和联系映射到可视化元素?
  2. 安排。如何显示可视化元素,是否有需要考虑的特殊问题?具体的例子可能是视点的选择、透明度的使用、或将特定的对象组分开。
  3. 选择。如何处理大量属性和数据对象?

3.最好是把这更笼统地表述为“。。。问题是什么”,因为选择以及安排在显示三维情节方面起着关键作用。

三维图的关键问题是如何显示信息,使尽可能少的信息被掩盖。如果情节是二维表面,那么观点(viewpoint)的选择是至关重要的。然而,如果情节是电子形式的,那么有时可以交互改变观点,以获得表面的完整视图。对于三维实体,这种情况更具挑战性。通常,为了提供必要的信息,必须省略部分信息。例如,通常会显示三维对象的切片或横截面。在某些情况下,可以使用透明度。同样,能够以交互方式改变视觉元素的排列方式也是有帮助的。

4. 简单随机抽样并不是最好的方法,因为它可以消除稀疏区域中的大多数点。最好对数据对象过于密集的区域进行欠采样,同时将大部分或所有数据对象保持在稀疏区域。

5.a. 网络的连接性最好用图表来表示,节点是路由器、网关或其他通信设备,而链路则表示连接。连接的带宽可以用链路的宽度来表示。颜色可用于显示链接和节点的使用百分比。

b.最简单的方法是在一张单独的世界地图上显示每一个物种,并对该物种出现的地区进行阴影处理。如果要同时显示几个物种,那么每个物种的图标都可以放在世界地图上。

C.每个程序的资源使用可以显示为三个数量的条形图。因为这三个量是不同的规模,一个适当的资源规模将是必要的,这样才能很好地工作。例如,资源使用率可以显示为总使用率的百分比。或者,我们可以使用三个条形图,一个用于资源使用类型。在每一个图上都会有一个条形图,其高度代表相应程序的使用情况。这种方法不需要任何扩展。另一种选择是显示每个程序的资源使用情况例如,资源使用率可以显示为总使用率的百分比。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

古道西风瘦码

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值