matlab就业,基于MATLAB的就业数据的聚类分析

一 基 于 MATLAB的 就 业 数 据 的 聚 类 分 析 邹 全 常程威 贾月月 (常州 工学 院 电气 与光 电工程学 院 ,江苏 常州 213100) 摘 要 :根据20lO年到2O13年我院校大学生就业情况 ,对大学生的就业数据进行 分析 。数据分析有很 多方法 .本 文主要 采用 谱 系聚类 、K均值 聚类、模糊C均值 聚类三种 聚类方法 ,并得 出了结论 。 关键词 :MATLAB 聚 类分析 就业数据 随着中 国高校教育 的发展 ,大学生人 数急剧增加 ,就业问 题 日益突出 ,大学 生就业难 的问题 已成 为社会 热点 、难 点 。根 据2010年到2013年近 四年 我院校大学生就业情况 .对大学生 的就业数据进行聚类分 析。根据就业数据可 以对 学生选择就 读的专业及学校本科办学提供一定 的参考价值 。 聚类分析是多元统计 分析的一种 ,也是非监 督模 式识别 的重要分支 。在模式 分类 、图像 处理和模糊规则处 理等众多领 域获得最广泛应用 。它把 一个没有类别标记 的样 本集按某种 准则划分为若干个子集 (类 ),使相似样 本尽可能归为一类 ,而 将不相似样本尽量划分到不 同类 中。 收集 和整理2010年到2013年这 四年我 院校 的就业 数据 . 对就业数据 中的就业率 、考研升学率和男女 生首次平均月收 入进行MA ⅡAB编程 ,得 出散点 图 ,并进行 分析 。对就 业数据 中毕业 生的就业流 向分别 采用谱系聚类 、K均值 聚类和模糊 C 均值聚类三种 聚类分析方法进行分析 。如表 1。 表 】 2010年至20I3年毕业生就业流向数据表 编号 地区 2010正 2011芷 2012正 2013拄 l 常州 521 420 564 431 2 南京 327 302 314 278 3 苏州 356 3O8 3l8 3o8 4 无锡 312 272 3o9 26o 5 镇江 87 75 89 68 6 扬州 113 82 102 90 7 南通 42 43 53 47 8 盐城 12 8 10 13 9 泰州 15 12 8 10 lO 宿迁 6 5 3 8 1l 淮安 4 5 O 3 l2 徐州 ll 2 9 4 13 连云港 2 O O 2 14 省外 121 lO3 l31 79 1.谱 系聚类算法的步骤 谱 系聚类首 先将每个样 品看成一类 ,然后把最相似 的样 品聚为一小类 ,再将 已聚类 的小类按各 类之间的相似性进行 再 聚类 ,随着相似 度减弱 ,最后将 一切子类 都聚 为一大类 ,从 而得到一个按相似度大小聚集起来 的谱 系图⋯。 利用谱 系聚类算法对表 1的就业流 向数据进行 聚类分析 。 将 数据分成3类 ,从程序 输出 的结果得 出结论 ,共 可分成 3类 , 常州单 独为一类 ,南京 、苏州 、无 锡为一类 。剩下的镇江 、扬州 、 南 通之类的归为一类。也就是说 ,很 多外地 毕业 生就在 常州发 展 ,很大一部分毕业生 去南 京 、苏州 、无锡工作 。还有一小部分 毕业生去了镇江 、扬州 、南通 。还有省外等地 。 154 2.K均值聚类算法的步骤 谱 系聚类法 是先将每一个样 品看成 一类 ,通过 比较距 离 的大小逐步扩充 类 ,因此 ,对于 给定的数 据 ,谱系 聚类一定 能 将样 品合并成 为一类 ,分类结果 唯一 ,但谱系聚类有 一个缺 点 ,就是样品一旦被分到某一类 中就不能改变 了 .且 当样 品容 量较大 时,计算量相应变大。克服这一缺点 的办法就是K均值 聚类法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MATLAB是一种功能强大的编程语言和环境,其包含了各种算法和工具,可以用于聚类分析多维数据。聚类是一种无监督学习技术,用于将数据的对象分组到相似的类别。这种技术对于在数据发现隐藏模式和结构非常有用。 在MATLAB聚类分析可以通过使用一些内置的函数和工具箱来实现。其最常用的是Statistics and Machine Learning Toolbox和Bioinformatics Toolbox。 使用这些工具箱,可以使用各种聚类算法,例如K均值聚类、层次聚类和期望最大化(EM)算法。给定一个多维数据集,可以将数据输入到聚类算法,并获得每个数据点所属的聚类标签。 聚类结果通常可以通过可视化方法来展示。MATLAB提供了丰富的绘图和可视化函数,可以帮助用户将聚类结果简洁地呈现出来。例如,可以使用散点图来显示不同聚类的数据点,并使用不同的颜色或标记来区分它们。 除了内置的函数和工具箱之外,MATLAB还支持用户自定义聚类算法的开发。用户可以使用MATLAB的编程功能创建自己的聚类算法,并根据特定需求进行调整和优化。 总之,MATLAB是一个功能强大的工具,可以用于聚类分析多维数据。它提供了丰富的函数和工具箱,可以帮助用户选择适合的聚类算法,并进行数据分析和可视化。无论是对于研究人员还是数据分析专业人员来说,MATLAB都是进行聚类分析的一个有力工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值