Weka下的线性回归分类 以及 基于预测值进行分类

Weka 的Liner Regression并且用Liner Regression的预测值进行分类
简单了解一下这个概念吧
Classification by regression
Linear regression can be used for classification too. On the diabetes data, use the NominalToBinary filter to convert the two classes, which are nominal, to the numeric values 0 and 1, and apply linear regression. The result is a predicted number between 0 and 1 for each instance. The addClassification filter is used to add that number as a new attribute; then OneR is applied to choose a good split point on that attribute to predict the original two classes. The procedure is a bit cumbersome, but the result works quite well as a classifier.

线性回归也可以用于分类。在糖尿病数据上,使用名称-二进制过滤器将两个类(名义值)转换为数值0和1,并应用线性回归。结果是每个实例的预测值在0到1之间。addClassification过滤器用于将该数字添加为一个新属性;然后,在该属性上选择一个好的拆分点来预测原来的两个类。这个过程有点麻烦,但是结果很好地作为分类器。
以一个Weka中的糖尿病的案例进行解释吧
首先我们的打开diabetes.arff 这个数据集文件打开后的界面
通过右侧面板看到,class为的值为tested-negative 和tested-positive 为名词性分类,这使得我们无法使用线性回归模型进行预测,所使用NominalToBinary将其进行转化为数字型的0、1。过滤器位置:filter-》Unsupersived-》NominalToBinary(在supervised中也含有一个这样的过滤器,两者本质的区别,小菜 也不太清楚,有大神了解的,请赐教)
过滤器
点击Apply应用,惊奇的发现我们的class属性的值并没有变化。原来这种转化对于分类属性是没有作用的。我们要把分类label 更改为No class更改分类选项
再进行Apply OK!
效果图效果图
此时值已变为0 和 1。
进入正题啦::::::
选择Liner Regression 分类器,按照图示进行输出配置。配置
下面我们看看输出的内容:
这里写图片描述
这里写图片描述
第二章图片 actual:我们之前操作得到的0和1两个类型(数字型),Predicted:通过线性回归预测得到的值。error:误差大小
以上操作得到了 根据某一个点对预测的值进行了分类(划为0或1当中的一类)。


我们进行进一步的研究
使用有监督属性的Addclassification 过滤器将预测的值作为属性添加到数据集中。看配置图:
这里写图片描述
这里写图片描述

此时我们已经将预测的值作为classification属性的值放到了数据集中。这里写图片描述
下面我们将对 class进行转换,将其转换为名词性分类,因为我们后面将使用OneR分类方法,OneR方法只能针对于名词性进行。配置形式如图:
这里写图片描述
随后我们要把class label 进行设置,设置为class,如图所示:
这里写图片描述
我们实际上是想要使用classification的值来预测class的值,所以我们将其他属性删除掉。
随后进入classification面板使用OneR,注意此时要把 想要预测的属性更改了如图所示:这里写图片描述
使用OneR进行分类:
这里写图片描述
发现准确率只有70% 效果不佳。我们发现原来是过度拟合的原因:
这里写图片描述
我们更改OneR过滤器的属性。
这里写图片描述
更改之后我们发现,其准确率得到了很大的提高:
这里写图片描述

本人最近在学Seve 突然好想学舞蹈啊!哈哈哈!!

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
目录列表: 2dplanes.arff abalone.arff ailerons.arff Amazon_initial_50_30_10000.arff anneal.arff anneal.ORIG.arff arrhythmia.arff audiology.arff australian.arff auto93.arff autoHorse.arff autoMpg.arff autoPrice.arff autos.arff auto_price.arff balance-scale.arff bank.arff bank32nh.arff bank8FM.arff baskball.arff bodyfat.arff bolts.arff breast-cancer.arff breast-w.arff breastTumor.arff bridges_version1.arff bridges_version2.arff cal_housing.arff car.arff cholesterol.arff cleveland.arff cloud.arff cmc.arff colic.arff colic.ORIG.arff contact-lenses.arff cpu.arff cpu.with.vendor.arff cpu_act.arff cpu_small.arff credit-a.arff credit-g.arff cylinder-bands.arff delta_ailerons.arff delta_elevators.arff dermatology.arff detroit.arff diabetes.arff diabetes_numeric.arff echoMonths.arff ecoli.arff elevators.arff elusage.arff eucalyptus.arff eye_movements.arff fishcatch.arff flags.arff fried.arff fruitfly.arff gascons.arff glass.arff grub-damage.arff heart-c.arff heart-h.arff heart-statlog.arff hepatitis.arff house_16H.arff house_8L.arff housing.arff hungarian.arff hypothyroid.arff ionosphere.arff iris.2D.arff iris.arff kdd_coil_test-1.arff kdd_coil_test-2.arff kdd_coil_test-3.arff kdd_coil_test-4.arff kdd_coil_test-5.arff kdd_coil_test-6.arff kdd_coil_test-7.arff kdd_coil_train-1.arff kdd_coil_train-3.arff kdd_coil_train-4.arff kdd_coil_train-5.arff kdd_coil_train-6.arff kdd_coil_train-7.arff kdd_el_nino-small.arff kdd_internet_usage.arff kdd_ipums_la_97-small.arff kdd_ipums_la_98-small.arff kdd_ipums_la_99-small.arff kdd_JapaneseVowels_test.arff kdd_JapaneseVowels_train.arff kdd_synthetic_control.arff kdd_SyskillWebert-Bands.arff kdd_SyskillWebert-BioMedical.arff kdd_SyskillWebert-Goats.arff kdd_SyskillWebert-Sheep.arff kdd_UNIX_user_data.arff kin8nm.arff kr-vs-kp.arff labor.arff landsat_test.arff landsat_train.arff letter.arff liver-disorders.arff longley.arff lowbwt.arff lung-cancer.arff lymph.arff machine_cpu.arff mbagrade.arff meta.arff mfeat-factors.arff mfeat-fourier.arff mfeat-karhunen.arff mfeat-morphological.arff mfeat-pixel.arff mfeat-zernike.arff molecular-biology_promoters.arff monks-problems-1_test.arff monks-problems-1_train.arff monks-problems-2_test.arff monks-problems-2_train.arff monks-problems-3_test.arff monks-problems-3_train.arff mushroom.arff mv.arff nursery.arff optdigits.arff page-blocks.arff pasture.arff pbc.arff pendigits.arff pharynx.arff pol.arff pollution.arff postoperative-patient-data.arff primary-tumor.arff puma32H.arff puma8NH.arff pwLinear.arff pyrim.arff quake.arff ReutersCorn-test.arff ReutersCorn-train.arff ReutersGrain-test.arff ReutersGrain-train.arff schlvote.arff segment-challenge.arff segment-test.arff segment.arff sensory.arff servo.arff sick.arff sleep.arff solar-flare_1.arff solar-flare_2.arff sonar.arff soybean.arff spambase.arff spectf_test.arff spectf_train.arff spectrometer.arff spect_test.arff spect_train.arff splice.arff sponge.arff squash-stored.arff squash-unstored.arff stock.arff strike.arff supermarket.arff triazines.arff unbalanced.arff vehicle.arff veteran.arff vineyard.arff vote.arff vowel.arff water-treatment.arff waveform-5000.arff weather.nominal.arff weather.numeric.arff white-clover.arff wine.arff wisconsin.arff zoo.arff

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值