weka软件实现数值数据的离散化
十分简单,图形界面只需我们点击几个按钮即可。
步骤如下 :
Explorer→Open File→Preprocess→Filter→Choose[weka.filters.unsupervised.attribute.Discretize]→Click to set→apply
参数设置 :
1-about
: 概要,一个实例过滤器,将数据集中的数值属性转换为标称属性;
2-attributeIndices
: 属性索引,指定要执行的属性的范围,是一个逗号分隔的属性索引列表,带有"first"和"last"有效值,指定包含"-“的范围,例如"first-last”;
3-binRangePrecision
: 在生成bin标签时用于切割点的小数位数;
4-bins
: 段,段的数量;
5-debug
: 调试,如果设置为真,过滤器可以输出附加信息到控制台;
6-desiredWeightOfInstancesPerInterval
: 在每个间隔中为等频绑定设置所需的实例权重;
7-doNotCheckCapabilities
: 如果设置为true,则过滤器的功能在构建之前不会被检查,小心使用,以减少运行时间;
8-findNumBins
: 使用leave-one-out优化等宽容器的数量,不适用于等频;
9-ignoreClass
: 忽略类属性,在应用筛选器之前,类索引将被暂时取消;
10-invertSelection
: 反向选择,设置属性选择模式,如果是false则在范围内仅选择数值属性离散,如果是true则只有非选择的属性将被离散化;
11-makeBinary
: 生成二进制属性;
12-spreadAttributeWeight
: 扩展属性,当生成二进制属性时,将旧属性的权重传递到新属性中,不要给每一个新的属性一个旧的重量;
13-useBinNumbers
: 使用bin编号(如BXofY),而不是用于离散属性的范围;
14-useEqualFrequency
: 等频离散化,如果设置为真,则将使用等频而不是等宽。