基 于 主 成 分分 析 和 灰 色 聚 类 对 我 国 居 民 收 入 差 距 分 析(陈 宝 平)

作者:陈 宝 平

笔记:30各地区 行 业 的 平 均 工 资;

采 用 主 成 分 分析 对 每 个 地区1 0 年 的 泰 尔 指 数 降 维, 转 化 成 三 个 主 成 分 因 子;

通 过 灰色 聚 类 分析 主 成 分 得 分 矩 阵 , 将30 个 地 区 划 分 为 三 类;

居 民 收 入 从 东 部 到 西 部 递 减 , 具 有 明 显 的 区 域 性 、 集 聚 性 特 点。

 

引言:2003 年 至 20 1 6 年 全 国 居 民 人 均 可 支 配 收 入 基 尼 系 数 均在〇 . 4 以 上;

良 好 的 收入 差 距 测 度 指标 需 具 备 匿 名 性 、 齐 次 性 、 总 体 独 立 性 、 转 移 性 和 强 洛 伦 兹一 致性;

 

测算:中 国 劳动 统 计 年 鉴;

农林牧 采矿业 制 造 业 电 热 燃 建 筑 业 批 零 售 交 通运 住 宿 餐 信传 输;

行 业 平 均 工 资 泰 尔 指 数 ( t h e i l ) , 简 称 行 业 泰 尔 指 数 或 泰 尔 指 数,由 广 义 熵 指 数 转 化 而 来 ,

 

主成分分析:主 成 分分 析 是一 种分 析、 简 化 数据 集 的 技 术 , 可 以 有 效 的 降 低 维 数 , 同 时 保持 了 数据 对 方 差
的 贡 献 , 通过 保 留 低 阶 主 成 分 , 忽 略 高 阶 主 成 分 做 到 的.

其 基 本 思 想 是 : 设 法 将 原 来 具 有一 定相 关性 的 指 标 , 重 新 组 合 成一 组 新 的 相 互 无 关 的 综 合 指 标, 并 代替 原 来 的 指 标。

1) 设 有n 个 样 品, P 个 指 标 , 将 原 始 数据 标 准 化 , 得 到 标 准 化 矩 阵 ;

2 ) 建 立 变 量 的 相 关 系 数 阵 ;

3 )求R 的 特 征 值 和 相 应 的 单 位 特 征 向 量 ;

4 )计算 方 差 贡 献 率 和 累 计 方 差 贡 献 率:每 个 主 成 分 贡 献 率 代 表 原 数据 总 信 息 量 的 百 分比 ;

5 ) 确 定 主 成 分 : 设为 p 个 主 成 分 , 其 中 前m 个 主 成 分 包 含 的 数据 信 息 总量( 即 其 累 计 方 差 贡 献 率 ) 不 低 于8 0 % 时 , 可 以 取 前 m 个 主 成 分来 反 映 评 价 对 象 ;

6 ) 用 原 指 标 的 线 性 组 合来计算 各 成 分 得 分 :以 各 主 成 分 对原 来 指 标 的 相 关 系 数 为 权 , 将主 成 分 表 示 为 原 指 标 的 线 性 组 合 , 而 主 成 分 的 经 济 意 义 则 由 各 线 性 组 合 中 权数 较 大 的 指 标 综合 意 义 来 确 定;

7 ) 综 合 得 分 :以 各 主 成 分 的 方 差 贡 献 率 为 权 , 将其 线 性 组 合 得 到综 合 评 价 函 数 ;

8 )得 分 排 序:利 用 总 得 分 可 以 得 到 得 分 名 次.

 

选 取 表1中 的 数据 ,200 7- 20 1 6年 十 年 期 间3 0 个 地 区 的 居 民 工 资 收 入 的 泰 尔 指 数 , 来 研
究 地 区 收 入 差 距.由 于 这 十 年 工 资 存 在一 定 相 关性, 数据 之 间 会 有 重 叠 的 信 息 , 所 以 选 取 主 成分分 析方 法 , 达 到 降 维 目 的. 用 R 软 件 计算 相 应 的 特 征 值、 特 征 向 量 和 贡 献 率 , 结 果 见 表3 .
从 表3中 可 以 看 出 , 前 三 个 主 成 分 的 累 积 贡 献 率 达 到96 %, 各 指 标 的 解 释 程 度 分 别 为4 8 %、3 7 % 和 1 0 %, 且 前 三 个 主 成 分 的 特 征 值 分 别 为4 . 88、3 . 8 和 1 . 0 1, 从 第 四 个 主 成 分 开 始 ,其特 征 值 和 方 差 贡 献 率 的 大 小 都 在减 小 , 综 合1 0 项 指 标 信 息 能力 较 弱, 因 此 选 取 前 三 个 主 成分 进 行 分 析 比 较 合 适。

表4中 的r c l、r c 2 和 r c 3 分 别 表 亦 第一 主 成 分、 第 二 主 成 分 和 第 二 主 成 分 对2 00 7- 20 1 6年 十 个 变 量 的 载 荷 大 小 ,h 2 栏 是 成 分 公 因 子 方 差, 是 主 成 分 对 每 个 变 量 的 方 差 解 释 度. u 2 栏是 成 分 唯
一 性, 是 主 成 分 无 法 解 释 变 量 方 差 的 比 例 , 其 值 为l- l i 2.
从 表4可 以 看 出 第一 主 成分 和200 8 、 20 09 、 2 0 1 0 、 20 1 1、2 0 1 2 相 性关 较 大 , 第 二 主 成 分 和 20 1 3 、 20 1 4 、 2 0 1 5、2 0 1 6 相 关性 较 大 , 第 三 主 成 分 和200 7 相 关性 较 大, 都 已 达 到9 0 % 以 上 即 为 高 度 正 相 关 .

计算 成 分 系 数矩 阵 如 表 5 所 示.

 

灰色聚类分析:灰 色 聚 类 是一 种 重要 的 灰 技 术, 研 究 对 象 是 部 分 信 息 己 知 , 部 分 信 息 未 知 的“小 样 本”、“贫信息”不 确 定 系 统。灰 色 白 化 权 函 数 聚 类 属 于 灰 色 聚 类 , 是 以 灰 数 的 白 化 函 数 为 基 础 的 , 它将 聚 类 对 象 对 不 同 聚 类 指 标 所 拥 有 的 白 化 数 , 按 若 干 灰 类 进 行 归 纳 , 从 而 判 断 出 聚 类 对 象 属于 哪一 个 灰 类。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值