SPSS Modeler软件“类型”节点对于数据字段的一下具体含义,更详细的参考IBM官方的文档
一、字段类型解释
1、默认。具有未知存储类型和值的数据(例如,由于其尚未被读取)将显示为<默认值>。
2、连续。用于描述数字值,如范围 1-100的连续数值 。
3、离散。用于字符串值(可取的值的确切数量未知时)。读取数据后,将指定为标志、集合或无类型。
4、标志。用于表示两个不同的值,如0和1,ture和false。
5、集合(名义)。 用于描述具有多个不同值的数据,其中的每个值都被视为集合的一个成员,如 small/medium/large。
6、有序集合。用于描述具有顺序固定的不同值的数据。例如,1, 3, 5 是某个整数集合的默认排列顺序,而 HIGH, LOW, NORMAL(按字母升序)是某个字符串集合的顺序。任何能够使用集合字段的位置使用有序集合字段。
7、无类型。用于不属于任何上述类型的数据。
也可根据“类型”节点根据读取的值来做判断和指定,能自己指定还是自己指定吧,如果“数据源”的节点是Excel的话,只能通过读取值来指定类型,自己手动是无法设置的。
二、基于Excel数据源的类型设置
例如:“数据源”的节点是Excel,还未读取值的时候,“类型”节点显示的信息
点击读取值后,这时候,即使我们指定第二个字段为“连续”类型也没用,读取值后,还是会变成“集合”类型,但是可以设置成“有序集合”
三、基于可变格式的字段设置
数据是相同的,把上个例子的Excel复制到了txt文档
读取值时,部分字段没有达到我的预期
这时候是可以指定相关字段的类型的,比如我设置了两个“标志”,其中第四个字段,可用“连续”、“集合”、“有序集合”,但是用“离散”是不行的
附:本次测试使用的数据的截图