自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

翻译 数据标准化

数据标准化,是指将数据按比例缩放,使之落到一个特定的区间,数据标准化目的是为消除单位的影响,方便进行比较分析,常用的数据标准化方法有【0-1标准化】和【Z标准化】。0-1标准化0-1标准化也称为离差标准化,它是对原始数据进行线性变换,使结果落到[0,1]区间。0-1标准化还有个好处,就是很方便做十分制、百分之的换算,只需要乘上10或者100即可。计算公式:我

2016-10-30 23:01:19 7859

翻译 数据分组-重新编码

对于不等距分组操作,除了上一篇文章介绍的方法之外,还有一种方法:重新编码为不同变量。重新编码可以把一个变量的数值按照指定要求赋予新的数值,也可以把连续变量重新编码成离散变量,如把年龄重新编码为年龄段。第一步:打开“用户明细”数据文件,单击【转化】-【重新编码为不同变量】,弹出【重新编码为不同变量】对话框第二步:将【年龄】变量移入【输入变量->输出变量】框中,在右边的【输出变量】

2016-10-30 22:02:45 8728

翻译 数据分组-可视分箱

数据分组,根据分析目的将数值型数据进行等距或非等距分组,这个过程也称为数据离散化,一般用于消费分布,收入分布,年龄分布等。在excel中,使用vlookup函数的模糊匹配功能进行数据分组操作,非常方便。那么在spss中介绍一个功能叫做“可视分箱”。这里以“用户明细”数据为例了解一下用户的年龄分布特征。,"用户明细"数据中已经有“年龄”变量,现在需要将“年龄”变量进行分组操作,得到一个新

2016-10-30 20:33:20 17529

翻译 spss-数据抽取-拆分与合并

数据抽取也成为数据拆分,是指保留、抽取原数据表中某些字段、记录的部分信息,形成一个新字段、新纪录。分为:字段拆分和随机抽样两种方法。一:字段拆分如何提取“身份证号码”字段。身份证号码里面包含了许多信息,例如省份、城市、出生日期、性别等等。我们将它抽取出来,就可以得到相应的字段。也就可以做相应的分析了。如用户的省份分布、出生日期、性别等。大家都知道在excel中使用字符函

2016-10-18 22:12:53 39544 1

转载 spss-数据清洗-处理重复数据

数据导入之后就需要对数据进行清洗。数据清洗主要是对多余重复的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或者删除。接下来操作如何将重复数据处理操作。步骤一:选择【数据】-【标记重复个案】,在【标记重复个案】对话框中,将所有的变量都放入【定义匹配个案的依据】框中,其他选项如果没有特殊要求,保持默认设置即可。如图:这时就会生成一个重复数据记录标识

2016-10-14 21:59:28 25745 1

翻译 SPSS-数据处理-数据变量

spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中,我们称之为变量。接下来主要介绍两点有关变量的基础知识:一、变量的数据类型         二、变量的尺度一、变量的数据类型从所周知,变量分为不同的数据类型,分别是:a:数值型数据、b:字符型数据、c:日期型数据。a:数值型数据:直接使用

2016-10-09 21:09:40 6245 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除