大数据
文章平均质量分 80
亿是守候 & 亿是承诺
,
展开
-
python机器学习--sklearn数据集使用
文章目录1.sklearn介绍2.基本概括2.1 估计器2.2 转化器3.sklearn中iris莺尾花数据集使用1.sklearn介绍Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库 。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值科学库NumPy和SciPy联合使用。sklearn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预原创 2022-01-04 22:10:42 · 1652 阅读 · 0 评论 -
Python-学生信息管理系统.exe(代码)
学生信息管理系统的页面展示在前面已经介绍过了:Python-学生信息管理系统.exe下面是这个.exe文件完整代码,可以直接运行的代码代码如下所示import os #获取文件信息filename='stduent.txt'def main(): # 定义主函数 while True: #默认执行 menm() #调用定义的menm函数,打印主菜单功能 choice=int(input('请选择:')) #输入选择的功能 if ch原创 2022-01-04 21:49:44 · 319 阅读 · 0 评论 -
python基础教程--代码集合(上)
python基础教程代码总结原创 2022-01-04 14:58:28 · 1620 阅读 · 0 评论 -
决策树算法绘图——graphviz安装
Graphviz自带决策树绘图工具,可以通过安装库实现绘图,不需要手动绘图。下图为graphviz库的决策树绘制的图形1.下载graphviz进入官网:graphviz官网文件,下载之后,选择合适的版本下载即可,我选择的是graphviz–2.49.2版本安装按照默认选项即可安装完成2.配置环境安装之后,需要手动配置环境,找到安装好的graphviz2.49.2文件夹复制Bin下面文件夹的路径在window系统中配置环境变量找到我的电脑,点击属性,找到高级系统设置在高级–环境变量点原创 2021-11-10 22:00:36 · 3735 阅读 · 1 评论 -
Python机器学习---Pyecharts制作可视化大屏
文章目录Pyecharts可视化Map世界地图柱状图、饼图Pyecharts组合图表ECharts是由百度开源的基于JS的商业级数据图表库,有很多现成的图表类型和实例,而Pyecharts则是为了方便我们使用Python实现ECharts的绘图。使用Pyecharts制作可视化大屏,可以分为两步:1、使用分别Pyecharts分别制作各类图形;2、使用Pyecharts中的组合图表功能,将所有图片拼接在一张html文件中进行展示。小五认为影响大屏美观最重要的两个因素就是:配色和布局!在本文中,会特意原创 2021-10-01 15:49:33 · 8611 阅读 · 4 评论 -
Python机器学习---2.聚类分析代码部分
1. 手写⼀个简单的Kmeans算法导入所需要的包# 导入一些包import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import make_blobs模拟数据# 模拟出一些数据集出来#r = np.random.randint(1,100)r = 4#print(r)k原创 2021-09-26 22:06:11 · 1620 阅读 · 0 评论 -
Python机器学习---2.聚类算法理论部分
文章目录1.聚类分析1.1 无监督学习与聚类算法1.1.1.旨在理解数据自然结构的聚类1.1.2 用于数据处理的聚类1.2 核心概念1.2.1 聚类分析1.2.2 簇1.3 基于原型的聚类技术: K-Means1.3.1 基于原型的簇1.3.2. K-Means基本定义1.3.3 算法执行细节距离衡量方法文本距离1.3.4 误差平方和SSE (Sum of the Squared Error, SSE)1.3.5 聚类目标函数和质心计算方法1.聚类分析1.1 无监督学习与聚类算法决策树、线性和逻辑回归原创 2021-09-26 19:58:43 · 1262 阅读 · 0 评论 -
Python机器学习--KNN归一化、距离的惩罚
1. 归一化1.1 距离类模型归一化的需求什么是归一化呢?我们把X放到数据框中来看一一眼, 你是否观察到,每个特征的均值差异很大?有的特征数值很大。有的特征数值很小,这种现象在机器学习中被称为"星纲不统一"。 NN是距离类模型,欧氏距离的计算公式中存在若特征上的平方和:试想看看,如果某个特征x的取值非常大,其他特征的取值和它比起来都不算什么,那距离的大小很大程度上都会由这个巨大特征x来决定,其他的特征之间的距离可能就无法对d(A,B) 的大小产生什么影响了,这种现象会让KNN这样的距离类模型的效果大原创 2021-09-23 22:41:25 · 905 阅读 · 0 评论 -
Python机器学习-- KNN学习曲线、K值、交叉验证
文章目录1.breast_cancer 数据集准确度计算2.学习曲线2.1 选择最优K值2.2 不同K取值对模型的影响2.3 神器之一:学习曲线2.3.1 选取最优的K值2.4交叉验证2.4.1 泛化能力2.5 神器之二:K折交叉验证2.6 绘制带交叉验证的学习曲线2.7 是否需要验证集?2.8 交叉验证的方法2.9 避免折数设置太大!1.breast_cancer 数据集准确度计算# breast_cancer 数据集from sklearn.neighbors import KNeighbors原创 2021-09-23 21:36:24 · 5518 阅读 · 0 评论 -
python的scikit-learn算法库实现
文章目录1.sklearn工具包2. sklearn 实现KNN3.breast_cancer 数据集1.sklearn工具包在机器学习的世界,总有着源码与调包之争。调包的人不需要对算法理解得太过深刻,对背后的数学原理长久不用可能也会忘记,只需要调用他人写好的代来达成自己的目的,因此被写源码的人嘲笑嫌弃,业界甚至流传着"调包侠”的恶名,指那些只会调用其他人写好的代码,自己不写代码的人。然而,这其实只是一种假象一真正自己写的,只有超巨大厂BAT,头条,小米等等这些公司,他们拥有巨大的技术团队,超强硬件支原创 2021-09-19 15:55:16 · 888 阅读 · 0 评论 -
python机器学习---1. K近邻算法
机器学习的方法是基于数据产生的"模型" (model) 的算法,也称"学习算法" (learning algorithm)。包括有监督学习(supervised learning)、无监督学习(unsupervised learning)、半监督学习(semi-supervised learning)、强化学习(reinforcement learning)。1. 有监督学习数据集中有X也有Y指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程;只要模型被确定,就可以应用到新的末知数据上.原创 2021-09-18 11:18:02 · 450 阅读 · 1 评论 -
python的matplotlib问题
1.X轴修改问题导入需要的安装包import pandas as pdimport numpy as np#设置画图风格与图片中文字体from matplotlib import pyplot as pltplt.style.use("ggplot")plt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.unicode_minus'] = False#显示所有列pd.set_option('display.max_c原创 2021-09-17 14:20:30 · 96 阅读 · 0 评论 -
python统计分析---6.主成分分析
文章目录1. 主成分分析1. 主成分分析#导入包import numpy as npimport pandas as pdimport statsmodels.formula.api as smffrom sklearn import linear_modelimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline#使用pandas读取数据支持xls和xlsxdata=pd.read_excel("b原创 2021-09-15 22:33:19 · 2701 阅读 · 2 评论 -
Python统计分析--- 5.统计法与随机梯度下降(SGD)
#导入包import numpy as npimport pandas as pdimport matplotlib as pltimport statsmodels.formula.api as smffrom sklearn import linear_modelimport matplotlib.pyplot as plt%matplotlib inline#使用pandas读取数据支持xls和xlsxdata=pd.read_excel("bankloan_binning.xls原创 2021-09-15 15:22:57 · 524 阅读 · 0 评论 -
python统计分析--4.Logistic回归
文章目录1. python数据处理标准流程2. 混淆矩阵与预测3. 交叉验证4. 网格搜索5. pipeline管道#导入包import numpy as npimport pandas as pdimport statsmodels.formula.api as smffrom sklearn import linear_modelimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.model_selection i原创 2021-09-14 21:20:15 · 4666 阅读 · 0 评论 -
python统计分析--3.线性回归四种算法
文章目录1. 最小二乘法1.1 最小二乘法1.2 正则化回归1.3 SGD随机梯度下降法2. 相关分析几种加速方法statsmodel–>sklearnols最小二乘法,运算时间长,处理速度慢,占用内存大sgd梯度下降法–需要内存小,可以处理大型数据—可以处理过拟合和稀疏数据(0和1)正则化–占用内存小,可以处理过拟合和稀疏数据n_jobs=-1 加速处理数据,所有内存来处理数据批次/在线/mini bactgh加速Gpu、cpu加速,sklearn不擅长Gpu、cpu加速,深层神经网原创 2021-09-14 15:28:27 · 1155 阅读 · 0 评论 -
python统计分析--2.预分析:异常值、缺失值处理
文章目录1.缺失值处理1.1 导入数据1.2 观察数据1.3 缺失值处理方法2. 异常值处理2.1 异常值---强异常值的处理2.2 特征筛选(Filter过滤法)2.3 共线性2.4 logistics、对数、指数、逆、幂、曲线的绘制3.编码3.1 异常值---多变量异常值处理3.2 特征筛选1.缺失值处理1.1 导入数据先导入各种需要的包,导入数据#导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pl原创 2021-09-13 19:05:19 · 1863 阅读 · 2 评论 -
python统计分析 --- 1.方差分析、t检验
文章目录1. 统计包与数据挖掘1.1 数据分析流1.2 数据统计包2. 方差分析2.1. 卷烟厂案例1. 统计包与数据挖掘1.1 数据分析流进行数据分析应该遵循一个什么样的步骤1.2 数据统计包numpy1.pandas提供basestat功能:单变量、双变量数据分析,包括描述统计(集中和离散、图形、交叉表)、相关分析(r、卡方)等。2.statsmodels提供假设检验及统计模型功能,主要研究结构性归因问题,并不强调预测功能,主要为推论统计小数据服务。3.sklearn提供数据挖掘模原创 2021-09-11 12:16:51 · 1801 阅读 · 1 评论 -
python基础总结--- 列表、内置函数(4-5)
文章目录6. 列表6.1 列表的索引和切片6.2 修改列表的元素值6.3 列表的常用方法6.3.1 添加元素append6.3.2 添加元素 extend6.3.3 插入元素insert6.3.4 查找元素 in not in index count6.3.4.1 查找 in / not in6.3.4.2 索引元素位置index(可以索引字母或者字符串)6.3.4.3 索引元素数量count6.3.4.4 索引元素位置find(只能索引字符串)6.3.5 删除元素6.3.5.1 根据下标删除del6.3.原创 2021-09-03 19:28:26 · 992 阅读 · 0 评论 -
python基础总结---安装、语法、变量、数据类型、计算、语句、(1-3)
文章目录1.python软件配置---jupyter notebook1.把pip升级到最新版本2. 安装Jupyter Notebook3.jupyter notebook启动2 python基础语法2.1 数字和字符串定义方法2.2 布尔数据类型bool2.3 jupyter默认输出功能2.4 print( )打印功能2.5 shift+tab 查看帮助文档2.6 tab补全代码功能(重点)2.7 python注释功能2.8 input输入3. 变量3.1 变量的赋值3.2 变量的命名规则3.3 内部保原创 2021-09-01 22:16:14 · 1522 阅读 · 0 评论 -
jupyter notebook快捷键
Jupyter 笔记本有两种不同的键盘输入模式。 编辑模式允许您将代码或文本输入到一个单元格中,并通过一个绿色边框的单元格来表示 命令模式将键盘与笔记本级命令绑定在一起,并通过一个灰框、左边距蓝色的单元格显示。命令行模式(按 Esc 生效)F: 查找并且替换Ctrl-Shift-F: 打开命令配置Ctrl-Shift-P: 打开命令配置Enter: 进入编辑模式P: 打开命令配置Shift-Enter: 运行代码块, 选择下面的代码块Ctrl-Enter: 运行选中的代码块Alt-Ent原创 2021-09-01 16:11:04 · 387 阅读 · 0 评论 -
04.Python基础_列表_元组_字典_集合
文章目录1.列表1.1list2.列表的索引和切片练习1 提取数据练习2 用索引取出下面list的指定元素:3.修改列表的元素值4.列表的常用方法4.1append添加元素(与extend有区别)4.2练习 使用for循环,把随机生成的数字一次添加到列表中去4.3 extend 添加数据(与append有区别)4.4 extend 与 append的区别4.5 insert插入元素4.6 查找元素 in not in index count4.6.1 in的用法 检测该元素是否在里面4.6.2not取反4.原创 2021-08-05 22:08:51 · 741 阅读 · 0 评论 -
03.Python基础--控制流语句-顺序结构-判断结构-循环语句
文章目录1.控制流语句1.1 if条件判断1.1.1 布尔类型和其他数据类型之间的转换关系1.1.2 if 嵌套1.1.3 列表1.2 循环语句1.2.1 for循环1.2.2 whlie循环1.2.3打印-1到-20中所有3的倍数1.2.4 break退出本"层"循环1.2.5 continue结束本"次"循环1.2.6 练习 寻找水仙花数1.控制流语句顺序语句从左到右, 从上到下1.1 if条件判断计算机之所以能做很多自动化的任务,因为它可以自己做条件判断。比如,输入用户年龄,根据年龄原创 2021-07-11 19:47:31 · 540 阅读 · 1 评论 -
02.Python基础_标准数据类型_数值型_字符串
文章目录1.标准数据类型1.1 数据类型1.1.1 整数型int1.1.2 浮点型float1.2 数字类型的转换1.2.1浮点转整数型1.2.2 整数型转化为浮点型1.2.3 数值型转化为字符串1.2.4 字符串转化为整数1.3 数值的计算1.3.1运算的优先级1.3.3 math科学计算库1.3.4 小练习: 计算根号5加上17的平方的结果取10的对数的1.3.5 复合赋值运算符1.3.6 python中的比较运算符1.3.7 逻辑运算符1.4 字符串1.4.1 长字符串1.4.2 关于单引号和双引号以原创 2021-07-05 21:29:15 · 961 阅读 · 0 评论 -
01.Python基础_菜单_快捷键_基本语法_变量_输入输出
文章目录1.编程软件—jupyter notebook2.基本说明2.1 标题2.2 排序2.3Jupyter notebook使用/快捷键2.4Markdown的基本语法3.python基本语法3.1 数字和字符串定义方法3.2 布尔数据类型bool3.3 jupyter默认输出功能3.4 In[] Out[]中括号中的数字, 以及星号, 打断功能3.5 python的print()功能, 帮助文档的使用方法3.5.1 打印单个值, 打印空行3.5.2 tab键作用3.5.3 打印一个值, 打印多个原创 2021-07-04 18:46:41 · 902 阅读 · 0 评论 -
数据分析惯用的5种思维方法
网上看到一篇文章对数据分析常用的5种思维方法进行了总结,我觉得写的是很不错的,分享给大家:数据分析惯用的5种思维方法常见的5种数据分析方法,分别是:公式法、对比法、象限法,二八法,漏斗法,常常多种结合一起使用。确实单一的方法不适合,一般一个数据采用多种方法进行融合分析。1.公式法...原创 2021-06-27 14:59:26 · 612 阅读 · 0 评论 -
13.Excel业务建模——RFM模型
文章目录1.RFM模型介绍1.1 基本简介1.1.1 最近一次消费R1.1.2 消费频率F1.1.3 消费金额M2.客户分类3.实现步骤4.用户分类模型RFM总结5.分析报告6.案列分析7.商业报告撰写注意点1.RFM模型介绍RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。1.1 基本简介根据美国数据库营销研究所Arthu原创 2021-06-27 14:32:24 · 1238 阅读 · 0 评论 -
12. Excel数据可视化看板--动态销售月报看板
文章目录1可视化看板作用1.1 形象直观,有利于提高效率1.2 透明度高,便于配合和监督1.3 降低成本,缩短生产周期1.4 传递现场的生产信息,统一思想1.5 杜绝现场管理中的漏洞1.6 绩效考核的公平化、透明化1.7 保证生产现场作业秩序,提升公司形象2.业务需求2.1 业务背景2.2 确认报告使用背景2.3 确认数据2.4 分析思路解读2.5 操作思路3.案例分析--可视化看板制作3.1 合并表格3.2 分析数据3.3 VLOOKUP简介3.4 VLOOKUP使用1可视化看板作用可视化管理看板作用原创 2021-06-18 22:50:33 · 6251 阅读 · 0 评论 -
11.Excel数据分析-复合型饼图与漏斗图
文章目录1.复合条饼图绘制1.1 会员与非会员1.2 值标签2.漏斗图绘制2.1 辅助列与转换率2.2 建立堆积条形图2.3 辅助列左移2.4 辅助列无填充2.5 调整坐标轴顺序2.6 条形图百分比1.复合条饼图绘制根据提供的数据,这里选择绘制饼图。做法十分简单选中所需要绘制饼图的区域,这里选择B2到C5,然后点击所有图表,选择复合条饼图刚开始饼图是这样的,我们需要对饼图做一些适当地调整为如下格式大概后续就是调整成这个样子1.1 会员与非会员首先这里是按照每一部分分开区域排布的,所以我们原创 2021-06-16 17:00:29 · 3612 阅读 · 0 评论 -
10.Excel数据特征分析-帕累托分析法
文章目录1.什么是帕累托分析2.帕累托分析法案例3.数据透视表与帕累托分析结合具体步骤3.1数据透视表建立3.2 帕累托图的建立3.3 调整帕累托图3.3.1调整坐标轴3.3.2 调整柱形图间距3.3.3 调整累计占比百分比3.3.4调整到原点4.帕累托分析图个人总结EXCEL中的帕累托分析需要结合前一章所学过的数据透视表的功能才能实现,先用数据透视表汇总所学的类别,然后再进行帕累托分析。1.什么是帕累托分析帕累托分析法是基于帕累托法则的一种分析法。先来说说什么是帕累托法则,其原型是19世纪意大利经原创 2021-06-15 22:08:23 · 4660 阅读 · 0 评论 -
9.Excel数据透视表
文章目录1.筛选2.数据透视表分析数据透视表能对数据进行归纳总结,非常好用,本文就从这里给大家距离介绍一下数据透视表使用方法这里举一个我这里有数据的案例案例一(初始需求较明确) :背景: 市场部打算做一场高低客单价的组合促销,需借鉴历史商铺经营数据;目标: 希望提供最近两个月各商铺的销售额、销量、客单价;交付物形式:Excel 3.1案例一分析思路:1 和需求方确认数据范围,时间维度为最近两个月(注意需确认最近两个月是自然月还是基于当前时点的最近两个月) , 渠道维度需确认线下消费、APP或原创 2021-06-14 18:34:59 · 694 阅读 · 0 评论 -
8.Excel数据与指标概述
文章目录1.数据分析结构1.1认识数据-表格结构1.2 认识数据-关系型表结构1.3 认识数据-关系型表结构1.4 认识数据-非关系型表结构1.5 认识数据-对比2.指标的作用3.汇总类指标4.对比类指标5.案例5.1 人力资源框架数据的分类汇总1.数据分析结构从理解数据开始数据来源于日常生活使用通信设备中数据chun1.1认识数据-表格结构特点●支持任意单元格内容的增删改●通过行列索引|定位单元格●支持合并单元格1.2 认识数据-关系型表结构特点●单表内数据用于描述一个业原创 2021-06-12 16:50:52 · 2225 阅读 · 0 评论 -
7.Excel数据分析-员工考勤表
制作一个员工考勤表,包含年月日星期的所有内容如图所示1.制定年先确定年,这里以2019,2020,2021三年为例选择单元格–数据–数据验证序列–来源–2019,2020,2021显示结果如下2.制定月也是同样的道理效果如下3.制定日每年的每个月多少填都是变化的,如何制作来确定每个月有多少天呢,这里的话就需要用到我们之前学到的内容了不知道大家是否还记得前面**5.Excel日期时间函数类应用**的内容了,不懂的可以回去看一下,这里就不重复介绍了先上代码 =IF(H25原创 2021-06-01 22:21:17 · 2063 阅读 · 0 评论 -
6.Excel项目排期表
项目时长比较简单,直接两个单元格相减用结束时间-开始时间距离结束还剩几天=IF(D22<TODAY(),0,IF(D22=TODAY(),“仅剩今天”,D22-TODAY()))解释:这里采用if去判断还剩几天,如果结束时间<今天,说明已经结束,返回0如果结束时间>=今天,有两种情况:当结束时间=今天的话,返回仅剩今天如果结束时间>今天,返回结束时间-今天时间项目阶段图描述选中区域插入堆积条形图效果不好选择添加的单元格逆序点击无填充把日原创 2021-05-30 23:11:54 · 1158 阅读 · 0 评论 -
5.Excel日期时间函数类应用
1.year获取指定日期的年=year(单元格)2.month获取指定日期的月=month(单元格)3.day获取指定日期的日=day(单元格)4.today获取系统当前日期=today(),这里获取当前日期是不需要填入信息的。5.now获取系统当前日期和时间直接输入=now()得到的结果是没有秒钟的日期需要修改一下才能得到快捷方法:点击单元格右键,设置单元格格式在这里加上:SS就好了结果如下6.date返回标准日期格式的时间序列=date(2021,5,30)原创 2021-05-30 20:34:49 · 685 阅读 · 0 评论 -
4.EXCEL数据分析概述
热点问题解读什么是数据分析?无纸化办公、数据存储、发现数据价值为什么需要数据分析?记录业务轨迹,参考及思考数据分析的分类?业务数据分析、数据挖掘、大数据分析数据分析师的市场需求?蓝海市场,大学数据分析专业暂无,供不应求数据分析方法分类1.业务数据分析(SQL、Execl等)描述性分析;数据透视;可视化图表2.数据挖掘分析(Python、SPSS、SAS、R等)协同过滤;分类分析;关联分析;聚类分析等;3.大数据分析(Hadoop、Spark等)Hadoop大数据平台原创 2021-05-28 22:34:28 · 870 阅读 · 0 评论 -
3.Excel数据透视表
1.数据透视表优势1.“拖”字大法易操作2.统计规则丰富可计算3.排序、筛选、添加计算列方法多切片器数据透视表制作点开EXCEL选择所需要做数据透视表的区域点击插入–数据透视表,然后选择数据透视表的位置点击确认即可(数据透视表下方是不能有数据的)2.图表分类图表将复杂的数据转变成清晰的可视化效果,能直观体现数据间关系比较类:柱形图、条形图、折线图、雷达图构成类:饼图、树状图、旭日图分布、联系:散点图、气泡图统计类:直方图、箱型图...原创 2021-05-27 20:43:28 · 257 阅读 · 0 评论 -
2.Excel公式函数
1.公式的定义用于描述数据间关系,编辑公式时,以等号为起始,等号右侧输入运算规则2.运算符算术运算符^ 乘方*乘/除+加-减文本运算符&链接文本“张”&“三”=“张三”关系运算符=等于大于<小于<> 不等于3.单元格地址引用绝对引用公式中引用的单元格地址不随填充柄、粘贴等操作发生改变单元格地址的行号和列号前都加上$ (刀号) ,加刀快捷键F4或Fn+F4相对引用公式中引用的单元格地址随填充柄、粘贴等操作发生相对位置改变如相原创 2021-05-26 21:58:55 · 356 阅读 · 0 评论 -
1.Excel业务分析数据
大数据分析入门第一部分1.Excel业务分析数据Excel基本操作对象1.工作薄:扩展名 xls、xlsx、xlsm,保护2.工作表:插入、复制、移动、重命名、保护等3.单元格:单元格属性、单元格地址、单元格区域地址1.数据加工1.1 数据类型文本:字母、汉字或者特殊字符(*),默认靠左对齐数值:整数,小数,默认靠右对齐逻辑值:“真”True “假”False常见于逻辑判断结果错误值:以#为起始的错误,如#VALUE, #DIV/O!,#NAME!,#N/A等1.2 快捷操作原创 2021-05-25 21:56:13 · 485 阅读 · 0 评论 -
SPSS的算法介绍与实现
本文介绍一些常用的算法和如何使用SPSS实现1.聚类分析1.概述聚类分析(cluster analysis)也称群分析、点群分析,是一种无监督学习,与回归分析、多元分析称为多元分析的三大方法。是一个把数据对象划分成子集的过程。每个子集是一个簇(cluster),使得簇中的对象彼此相似,但是与其他簇中的对象不相似。由聚类分析产生的一个簇的集合叫做一个聚类。2.基本思想:我们所研究的样品或指标(变量)之间存在程度不同的相似性(亲疏关系——以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些原创 2021-06-12 17:18:51 · 2874 阅读 · 0 评论