Weka-无监督属性过滤器-AddExpressionMathExpression[6-2]

本部分延续上一篇的研究,接着2个方法:AddExpression,MathExpression


AddExpression过滤器是通过将一个数学函数应用于数值型属性而生成1个新的属性。

其中,可以支持+、-、*、/、和^,函数log、abs、cos、exp、sqrt、floor、ceil、rint、tan、sin,属性通过索引加前缀a确定,例如a7表示第7个属性;


MathExpression过滤器与AddExpression过滤器类似,该过滤器只是修改现有属性,不创建新属性。所以,该表达式不能引用其他属性的值。

所有AddExpression过滤器的操作符都可以用,还包括属性的最大值、最小值、平均值、和、平方和、标准差。


具体差异看代码:

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;

import weka.core.Instances;
import weka.filters.unsupervised.attribute.AddExpression;
import weka.filters.unsupervised.attribute.MathExpression;

public class Expression_test {

	public static void main(String[] args) throws IOException, Exception {
		// 读入数据
		Instances data=new Instances(new BufferedReader
				(new FileReader("data\\weather.numeric.arff")));
		System.out.println("===========原始数据============");
		for(int i=0;i<data.numInstances();i++)
			System.out.println(data.instance(i));
		System.out.println();
		System.out.println("=======AddExpression:sqrt(a2^2*a3/log(a2*4.0))===");
		
		// 1,选择AddExpression类,设置实例的参数
		AddExpression addexp=new AddExpression();
		/*
		 *  AddExpression类是新建属性的
		 * -E 表示 输入的公式
		 * -N 表示新建属性的属性名
		 */
		addexp.setOptions(new String[]{"-E","sqrt(a2^2*a3/log(a2*4.0))","-N","exp"});
		addexp.setInputFormat(data);
		Instances newdata=weka.filters.Filter.useFilter(data, addexp);
		
		for(int i=0;i<newdata.numInstances();i++)
			System.out.println(newdata.instance(i));
		System.out.println();
		System.out.println("=======AddExpression:(A-MIN)/(MAX-MIN)===");
		
		
		// 2,选择MathExpression类,设置实例的参数
		MathExpression mathexp=new MathExpression();
		/*
		 *  MathExpression类是直接改原字段的,全部数值字段都会被转换
		 * -E 表示 输入的公式
		 *  A 表示当前使用的列
		 *  MAX 表示当前使用的列的最大值
		 *  A2 表示第二列
		 */
		mathexp.setOptions(new String[]{"-E","(A-MIN)/(MAX-MIN)"});
		mathexp.setInputFormat(data);
		newdata=weka.filters.Filter.useFilter(data, mathexp);
		
		for(int i=0;i<newdata.numInstances();i++)
			System.out.println(newdata.instance(i));
		System.out.println();
		System.out.println("========MathExpression:A2-MIN=========");	
		
		// 3,选择MathExpression类,继续试验公式输入
		mathexp.setOptions(new String[]{"-E","A2-MIN"});
		/*
		 *  A2  表示第2个字段列
		 *  MIN 表示当前使用的列的最大值(必须大写)
		 *  含义为:每列都以 A2去减去该列最小值 计算
		 *  比如:第2列最小值为64,第三列最小值为65,那么第3列计算替换的方法为使用A2-min(A3)
		 *  注:这个方法只有3.6weka以前版本没有
		 */
		mathexp.setInputFormat(data);
		newdata=weka.filters.Filter.useFilter(data, mathexp);
		
		for(int i=0;i<newdata.numInstances();i++)
			System.out.println(newdata.instance(i));
	}

}






  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值