spss之数据处理(离散化)

数据离散化是将连续数据转化为离散数据的过程,用于简化数据分析和提高处理效率。本文通过SPSS软件展示了数据离散化的步骤,包括选择变量、设置分箱点、生成标签等。同时,提到了C语言中unique函数用于数据去重的方法。离散化在保持数据相对大小不变的情况下,可以有效减少数据规模,便于后续的数据挖掘和分析。
摘要由CSDN通过智能技术生成

什么是离散化(数据分组)

把无限空间有限个体映射到有限空间里有限
白话:在不改变数据相对大小的条件下,对数据进行相对的缩小
例如:
原数据:7 1 4 3 处理后: 4 1 3 2
原数据:{100,250}{200,400} 处理后{1,3}{2,4}

步骤(SPSS):

(1)点击转换:
(2)点击可视分箱:
在这里插入图片描述

(3)将要离散化的变量转入“要分箱的变量”框中:点击继续:
在这里插入图片描述

(4)在“分箱化变量”中输入分箱后变量的名称(随便取):
在这里插入图片描述

(5)在“值”中输入想取的几个分割点数值:
在这里插入图片描述

(6)点击“生成标签”:
在这里插入图片描述

(7)点击确定:
在这里插入图片描述

(8)出现了新生成的字段列变量:
在这里插入图片描述

(9)排序
在这里插入图片描述

(10)在变量视图中查看具体分组
在这里插入图片描述

补充(使用C语言做数据离散化):

unique函数

头文件:#include<stdio.h>
格式: iterator unique(iteration it_1 , iterator it_2);
函数特性:
1.对容器中(it_1,it_2)范围的元素去重【把重复的元素添加到容器末尾,不改变数组大小】

2.返回值是一个迭代器

3.它指向的是去重后容器中不重复序列的最后一个元素的下一个元素

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值