机器学习面试+横扫千军
文章平均质量分 78
涉及机器学习面试的方方面面,包含理论、实践、项目以及面试技巧。理论部分主要参考统计学习方法和机器学习两本书的内容。使用(pandas、numpy、matplotlib、seaborn、keras、sklearn)等包进行对应的代码梳理。包含数据可视化、数据预处理、特征工程、模型建模、参数调优等。
Data+Science+Insight
毕业于中国科学院大学智能计算专业。研究方向为,数据挖掘、机器学习、深度学习等。深度参与了多项数据挖掘、计算机视觉以及自然语言处理相关项目,例如,社会计算、异常分析、聚类分析、预测分析、序列标记、语言生成、OCR、图像分类+检测+分割等。现任某茅数据科学家,负责数据科学团队的管理及项目实施。曾就职于中国信科集团,负责大数据与机器学习组的管理及项目实施。曾参与国家级医疗大数据平台机器学习项目的开发和建设、构建了完整的数据链路、特征池、模型仓库、迁移中心、数据应用、数据服务Pipeline,并与AWS team基于AWS云服务合作开发大型工业互联网项目,积累了工业互联网模型构建、部署、监控实战经验。
展开
-
混淆矩阵(confusion matrix)是什么?以及能从混淆矩阵中衍生出来的指标FPR、TPR、FDR、ACC、PPV、NPV分别是什么?对应的概念及公式是什么?
混淆矩阵(confusion matrix)是什么?以及能从混淆矩阵中衍生出来的指标FPR、TPR、FDR、ACC、PPV、NPV分别是什么?对应的概念及公式是什么?目录混淆矩阵(confusion matrix)是什么?以及能从混淆矩阵中衍生出来的指标FPR、TPR、FDR、ACC、PPV、NPV分别是什么?对应的概念及公式是什么?# 混淆矩阵#从混淆矩阵衍生出来的指标(FPR、TPR、FDR、ACC、PPV、NPV)# 混淆矩阵 混淆矩阵(...原创 2021-10-01 00:11:18 · 2182 阅读 · 5 评论 -
置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算?
置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算?目录置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算?#置信区间(Confidence Intervals)是什么?#置信区间的两种计算方法#案例一总体的标准差未知#案例原创 2021-09-14 00:08:56 · 1096 阅读 · 6 评论 -
熵是什么?熵的公式是什么?决策树如何把熵的递减变换为信息增益进行树枝的分叉以及树的生长的?
熵是什么?熵的公式是什么?决策树如何把熵的递减变换为信息增益进行树枝的分叉以及树的生长的?熵(entropy)在统计学中是一个很重要的概念,用于特征的选择,衡量结果的不确定性, 信息熵越小, 结果越有序,信息越明确,越不混沌。信息量度量的是一个具体事件发生了所带来的信息,而熵则是在结果出来之前对可能产生的信息量的期望,考虑该随机变量的所有可能取值,即所有可能发生事件所带来的信息量的期望。那自然是所有信息的求和。所以说,熵越大,不确定性越大,越无序;熵越小,确定性越大,越有序。随机变量Y的熵与Y的原创 2021-06-25 06:54:53 · 215 阅读 · 5 评论 -
标准化(standardization,z-score)与归一化(Normalizer)分别是什么?有什么区别?
标准化(standardization,z-score)与归一化(Normalizer)分别是什么?有什么区别?首先因为翻译以及各种原因这两个东西很多情况下是一锅粥的状态;我们今天以sklearn中提供的API来做一个统一的说明:标准化(standardization,z-score)从列的角度来处理特征数据标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下。标准的的标准方法是StandardScaler、RobustScaler、Mi原创 2021-06-24 08:38:30 · 3561 阅读 · 4 评论 -
参数化模型(parametric model)和非参数化模型non-parametric model)的区别?哪些模型是参数化模型,哪些模型是非参数化模型?
参数化模型(parametric model)和非参数化模型non-parametric model)的区别?哪些模型是参数化模型,哪些模型是非参数化模型?统计学习模型又可以分为参数化模型(parametric model)和非参数化模型(non-parametric model)。参数化模型假设模型参数的维度固定,模型可以由有限维参数完全刻画;非参数模型假设模型参数的维度不固定或者说无穷大,随着训练数据量的增加而不断增大。参数化与非参数学习算法参数学习算法(Parametric..原创 2021-06-23 08:33:24 · 4719 阅读 · 6 评论 -
MySQL的MVCC机制是什么?
MySQL的MVCC机制是什么?MySQL的MVCC机制Multiversion concurrency control 多版本并发控制并发访问(读或者写)数据库时,对正在事务内处理的数据做多版本的管理,用来避免由于写操作的堵塞,而引发读操作失败的并发问题。MVCC,Multi-Version Concurrency Control,多版本并发控制。MVCC 是一种并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问;在编程语言中实现事务内存。如果有人从数据库中读数据的同时原创 2022-02-18 07:12:07 · 786 阅读 · 9 评论 -
增强迪基-福勒检验(ADF检验、augmented Dickey-Fuller test)是什么?解决了什么问题?
增强迪基-福勒检验(ADF检验、augmented Dickey-Fuller test)是什么?解决了什么问题?原创 2022-02-10 07:10:16 · 2168 阅读 · 4 评论 -
python使用numpy包编写自定义函数计算SMAPE(对称平均绝对百分比误差)指标Symmetric mean absolute percentage error、SMAPE指标解读、指标使用的注
python使用numpy包编写自定义函数计算SMAPE(对称平均绝对百分比误差)指标Symmetric mean absolute percentage error (SMAPE)、SMAPE指标解读、SMAPE指标使用的注意事项原创 2022-02-10 07:12:13 · 1091 阅读 · 6 评论 -
回归模型和时间序列模型中的SMAPE指标是什么?SMAPE指标解读、SMAPE越大越好还是越小越好、使用SMAPE指标的注意事项
回归模型和时间序列模型中的SMAPE指标是什么?SMAPE指标解读、SMAPE越大越好还是越小越好、使用SMAPE指标的注意事项原创 2022-02-21 07:12:44 · 3483 阅读 · 4 评论 -
python使用numpy包编写自定义函数计算MAPE(平均绝对百分比误差)指标mean absolute percentage error (MAPE)、MAPE指标解读、MAPE指标使用的注意事项
python使用numpy包编写自定义函数计算MAPE(平均绝对百分比误差)指标mean absolute percentage error (MAPE)、MAPE指标解读、MAPE指标使用的注意事项原创 2022-02-08 07:09:55 · 2961 阅读 · 5 评论 -
回归模型和时间序列模型中的MAPE指标是什么?MAPE指标解读、MAPE越大越好还是越小越好、使用MAPE指标的注意事项
回归模型和时间序列模型中的MAPE指标是什么?MAPE指标解读、MAPE越大越好还是越小越好、使用MAPE指标的注意事项原创 2022-02-08 07:10:25 · 5113 阅读 · 6 评论 -
方差分析(Analysis of Variance,ANOVA)是什么?方差分析的形式有哪些?
方差分析(Analysis of Variance,ANOVA)是什么?方差分析的形式有哪些?原创 2022-01-23 08:53:43 · 649 阅读 · 6 评论 -
深度学习中的网络退化是什么?残差网络ResNet中的恒等映射是什么?
深度学习中的网络退化是什么?残差网络ResNet中的恒等映射是什么?原创 2021-11-26 00:03:54 · 3925 阅读 · 5 评论 -
python抽取timedelta中的天数、小时、分钟、秒钟信息
python抽取timedelta中的天数、小时、分钟、秒钟信息目录python抽取timedelta中的天数、小时、分钟、秒钟信息timedalta#示例的timedelta(只有天数和秒数显示)#抽取timedelta中的天数、小时、分钟、秒钟信息timedaltatimedelta 是datetime中的一个对象,该对象表示两个时间的差值构造函数:datetime.timedelta(days=0, seconds=0, microseconds=0,.原创 2021-11-18 07:10:28 · 2525 阅读 · 7 评论 -
Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日?
Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日?目录Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日?timedalta#python计算100天后是哪年那月那日?timedaltatimedelta 是datetime中的一个对象,该对象表示两个时间的差值构造函数:datetime.timedelta(days=0, seconds.原创 2021-11-16 07:10:46 · 383 阅读 · 6 评论 -
数据库查询语句SQL中like、%、-的区别
数据库查询语句SQL中like、%、-的区别数据库查询语句SQL中like、%、-的区别%百分号通配符:表示任何字符出现任意次数(可以是0次)SQL 语句选取 name 以字母 "k" 结尾的所有客户:SELECT * FROM WebsitesWHERE name LIKE '%k';执行输出结果:下划线通配符:表示只能匹配单个字符,不能多也不能少,就是一个字符.查询员工名称以员工1开头,且后面只有一个字符的人select * from #tmpEmpl.原创 2021-11-16 07:11:45 · 10255 阅读 · 6 评论 -
数据库中的字段varchar类型和char类型的区别?
数据库中的字段varchar类型和char类型的区别?目录数据库中的字段varchar类型和char类型的区别?字段varchar类型和char类型的区别:总结:字段varchar类型和char类型的区别:区别一,定长和变长,char表示定长,长度固定;varchar表示变长,长度可变。当插入字符串超出长度时,视情况来处理,如果是严格模式,则会拒绝插入并提示错误信息,如果是宽松模式,则会截取然后插入。如果插入的字符串长度小于定义长度时,则会以不同的方式来处理,如char(原创 2021-11-14 00:02:16 · 694 阅读 · 8 评论 -
MySQL 两种存储引擎:MyISAM与InnoDB对比及理解
MySQL 两种存储引擎:MyISAM与InnoDB对比及理解目前MySQL默认的存储引擎是InnoDB现在大多数时候我们使用的都是InnoDB存储引擎,但是在某些情况下使用MyISAM更好,比如:MyISAM更适合读密集的表,而InnoDB更适合写密集的的表。 在数据库做主从分离的情况下,经常选择MyISAM作为主库的存储引擎二者的常见对比count运算上的区别: 因为MyISAM缓存有表meta-data(行数等),因此在做COUNT(*)时对于一个结构很好的查询是不需.原创 2021-11-04 07:11:01 · 917 阅读 · 4 评论 -
什么是MySQL锁?有哪些锁类型?如何使用?
什么是MySQL锁?有哪些锁类型?如何使用?Mysql中有哪几种锁?行级锁:锁定力度小,发生锁冲突概率低,实现并发度高,开销大,加锁慢,并发度高 页级锁:加锁时间比行锁长,页级锁开销介于表锁和行锁之间,会出现死锁,并发度一般 表级锁:开销小,加锁快锁的概念在数据库中,多个线程或事物并发的时候,难免会出现访问到同一行数据资源的情况,为了避免这种情况下资源的竞争,数据库数据逻辑的一致性,要合理的控制事务访问的规则。而锁就是用来控制这些访问规则的重要工具。锁的分类我们经.原创 2021-11-08 07:14:24 · 245 阅读 · 6 评论 -
MySQL数据库中默认事务隔离级别是?
MySQL数据库中默认事务隔离级别是?事务的基本要素(ACID) 1、原子性(Atomicity):事务开始后所有操作,要么全部做完,要么全部不做,不可能停滞在中间环节。事务执行过程中出错,会回滚到事务开始前的状态,所有的操作就像没有发生一样。也就是说事务是一个不可分割的整体,就像化学中学过的原子,是物质构成的基本单位。 2、一致性(Consistency):事务开始前和结束后,数据库的完整性约束没有被破坏 。比如A向B转账,不可能A扣了钱,B却没收到。 3、..原创 2021-11-26 00:03:44 · 254 阅读 · 5 评论 -
数据索引是什么?索引作用是什么?什么样的字段适合建索引?索引的优缺点是什么?
数据索引是什么?索引作用是什么?什么样的字段适合建索引?索引的优缺点是什么?数据库索引,是数据库管理系统中一个排序的数据结构,索引的实现通常使用B树及其变种B+树。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。索引的作用:协助快速查询、更新数据库表中数据。索引的优点:索引可以保证数据每一行的唯一性 加快数据的检索速度缺点:创建和维护索引需要时间 索引需要占原创 2021-11-09 07:12:07 · 1379 阅读 · 5 评论 -
B树和B+树分别是什么?区别在哪里?MySQL使用的是哪一种树?
B树和B+树分别是什么?区别在哪里?MySQL使用的是哪一种树?B树,每个节点都存储key和data,所有节点组成这棵树,并且叶子节点指针为nul,叶子结点不包含任何关键字信息。B+树,所有的叶子结点中包含了全部关键字的信息,及指向含有这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大的顺序链接,所有的非终端结点可以看成是索引部分,结点中仅含有其子树根结点中最大(或最小)关键字。为什么MySQL用B+树呢?B+ 树查询效率更稳定(因为因为B+ 树每次只有访问到叶子节点原创 2021-11-07 08:32:37 · 454 阅读 · 7 评论 -
影像组学标签(radiomic signature)、影像组学评分运算公式(rad-score)
影像组学标签(radiomic signature)、影像组学评分运算公式(rad-score)在医学领域,影像组学是一种利用数据特征化算法从医学图像中提取大量特征的方法。这些特征被称为影像组学特征,有可能揭示肉眼无法观察到的肿瘤模式和特征。影像组学的假设是疾病形态之间的影像学特征可能有助于预测各种癌症类型的预后和治疗反应,从而为个性化治疗提供有价值的信息。影像组学产生于影像组学和肿瘤学的医学领域,是这些领域中最先进的应用。然而,这项技术可以应用于任何可以成像病理过程的医学研究。..原创 2021-10-30 00:02:39 · 12077 阅读 · 10 评论 -
广义线性模型GLM、GLMM、LMM、MLM、GMM、GEE、广义线性模型GLM和广义线性混合模型的GLMM区别
R语言广义线性模型GLM、GLMM、LMM、MLM、GMM、GEE、广义线性模型GLM和广义线性混合模型的GLMM区别目录R语言广义线性模型GLM、GLMM、LMM、MLM、GMM、GEE、广义线性模型GLM和广义线性混合模型的GLMM区别#广义线性模型(generalized linear model, GLM)#广义线性混合模型(GLMM ,generalized linear mixed model)#线性混合模型LMM#多水平模型MLM#高斯混合模型 GMM#广义原创 2021-10-24 00:04:16 · 2961 阅读 · 4 评论 -
关系型数据库和非关系型数据库的优劣对比?
关系型数据库和非关系型数据库的优劣对比?关系型数据库和非关系型数据库的优劣对比?关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织。优点:1、易于维护:都是使用表结构,格式一致;2、使用方便:SQL语言通用,可用于复杂查询;3、复杂操作:支持SQL,可用于一个表以及多个表之间非常复杂的查询。缺点:1、读写性能比较差,尤其是海量数据的高效率读写;2、固定的表结构,灵活度稍欠;3、高并发读写需求,传统关系型数据库来说,硬盘I/O是一个很大的瓶颈。原创 2021-10-29 00:10:40 · 196 阅读 · 5 评论 -
临时表,临时表什么时候删除
什么是临时表,有啥作用?临时表什么时候删除?什么是临时表,有啥作用?临时表,顾名思义就只是临时使用的一张表,一种是本地临时表,只能在当前查询页面使用,新开查询是不能使用它的,一种是全局临时表,不管开多少查询页面均可使用。临时表与永久表相似,但临时表存储在tempdb中,当不再使用时会自动删除。临时表有两种类型:本地和全局。它们在名称、可见性以及可用性上有区别。本地临时表就是用户在创建表的时候添加了“#”前缀的表,其特点是根据数据库连接独立。只有创建本地临时表的数据库连接有表的访问权限原创 2021-10-31 00:04:23 · 1479 阅读 · 5 评论 -
什么是数据库范式(NF)?从一范式到五范式分别是什么?
什么是数据库范式(NF)?从一范式到五范式分别是什么?什么是数据库范式(NF)?为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。范式的英文名称是 Normal Form ,简称 NF 。它是英国人 E.F.Codd 在上个世纪70年代提出关系数据库模型后总结出来的。范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵...原创 2021-10-24 00:04:46 · 2121 阅读 · 3 评论 -
什么是数据库视图(view),视图(view)优缺点是什么?
什么是数据库视图(view),视图(view)优缺点是什么?什么是数据库视图(view)?在 SQL 中,视图是基于 SQL 语句的结果集的可视化的表。视图包含行和列,就像一个真实的表。视图中的字段就是来自一个或多个数据库中的真实的表中的字段。我们可以向视图添加 SQL 函数、WHERE 以及 JOIN 语句,我们也可以提交数据,就像这些来自于某个单一的表。注释:数据库的设计和结构不会受到视图中的函数、where 或 join 语句的影响。视图:是一种虚拟的表,具有和物.原创 2021-10-26 00:03:50 · 2336 阅读 · 3 评论 -
数据库中触发器的作用是什么?
数据库中触发器的作用是什么?什么是触发器触发器是一种特殊的存储过程,只能由事件驱动调用,而无法直接调用。触发器有什么用当对数据库的相关对象(数据库、表、视图)进行某些特定的操作时,数据库会自动调用相应的触发器。无需再执行增删改或存储过程的操作,让程序更自动化。# 数据库中触发器的作用是什么?安全性,可以基于数据库的值使用户具有操作数据库的某种权利。 审计,可以跟踪用户对数据库的操作。 实现复杂的非标准的数据库相关完整性规则,触发器可以对数据库中相关的表进行连环原创 2021-10-30 00:04:09 · 3738 阅读 · 8 评论 -
为什么一般用自增列作为主键?
为什么一般用自增列作为主键?为什么一般用自增列作为主键?如果表使用自增主键,那么每次插入新的记录,记录就会顺序添加到当前索引节点的后续位置,当一页写满,就会自动开辟一个新的页 如果使用非自增主键(如果身份证号或学号等),由于每次插入主键的值近似于随机,因此每次新记录都要被插到现有索引页的中间某个位置,此时MySQL不得不为了将新记录插到合适位置而移动数据,这增加了很多开销,同时会增加大量的碎片1.从业务上来说在设计数据库时不需要费尽心思去考虑设置哪个字段为主键。然后是这些字段只是理原创 2021-10-24 00:05:07 · 935 阅读 · 3 评论 -
如何获取数据库中标的所有字段和数据类型?
如何获取数据库中标的所有字段和数据类型?目录如何获取数据库中标的所有字段和数据类型?#获取表中所有字段#获取表中的所有字段和数据类型#获取表中所有字段select name from syscolumns where id=object_id('表名') select name from syscolumns where id in (select id from sysobjects where type = 'u' and name = '表名')#获取表中原创 2021-11-01 10:07:14 · 206 阅读 · 5 评论 -
按照姓氏笔画排序数据、按照姓氏拼音排序数据
如何查询数据库中的数据并按照姓氏笔画排序数据?按照姓氏拼音那?目录如何查询数据库中的数据并按照姓氏笔画排序数据?按照姓氏拼音那?#按照姓氏笔画排序数据#按照姓氏拼音排序数据#按照姓氏笔画排序数据Select * From TableName Order By CustomerName Collate Chinese_PRC_Stroke_ci_as //从少到多#按照姓氏拼音排序数据--按姓氏笔画排序select * from student order b原创 2021-10-28 00:10:36 · 747 阅读 · 4 评论 -
如何判断数据库中的两个表是否相同(相等)?比较数据库中的两个表是否完全相同,包括字段和每条记录
如何判断数据库中的两个表是否相同(相等)?比较数据库中的两个表是否完全相同,包括字段和每条记录目录如何判断数据库中的两个表是否相同(相等)?比较数据库中的两个表是否完全相同,包括字段和每条记录#数据中的两个表是否相同比较#binary_checksum(*)#数据中的两个表是否相同比较if (select checksum_agg(binary_checksum(*)) from A) = (select checksum_agg(binary_check原创 2021-10-23 00:08:35 · 1263 阅读 · 1 评论 -
什么是描述性统计分析( descriptive statistics)?主要包含哪些内容?
什么是描述性统计分析?描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。集中趋势分析:集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?离中趋势分析:离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势.原创 2021-10-15 07:07:54 · 10152 阅读 · 5 评论 -
什么是列联表分析(Contingency table analysis)?
什么是列联表分析(Contingency table analysis)?列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。简介一般,若总体中的个体可按两个属性A、B分类,A有r个等级A1,A2,…,Ar,B有c个等级B1,B2,…,Bc,从总体中抽取大小为n的样本,设其中有nij个个体的属性属于等级Ai和Bj,nij称为频数,将r×c个nij排列为一个r行c列的二维列联表,简称r×c表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表.原创 2021-10-15 07:08:08 · 9867 阅读 · 4 评论 -
什么是推理统计(inferential statistics)?
什么是推理统计(inferential statistics)?推论统计是统计学乃至于心理统计学中较为年轻的一部分内容。它以统计结果为依据,来证明或推翻某个命题。具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显著性差异。例如,我们想研究教育背景是否会影响人的智力测验成绩。可以找100名24岁大学毕业生和100名24岁初中毕业生。采集他们的一些智力测验成绩。用推论统计方法进行数据处理,最原创 2021-10-19 00:02:40 · 2147 阅读 · 3 评论 -
什么是假设检验(hypothesis test)?什么是正态性检验(normality test)?
什么是假设检验(hypothesis test)?什么是正态性检验(normality test)?假设(hypothesis),又称统计假设,是对总体参数的具体数值所作的陈述。假设检验(hypothesis test) 是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。假设检验的特点就是采用逻辑上的反证法和依据统计上 的小概率原理。小概率事件在单独一次的试验中基本上不会发生,可以不予考虑。在假设检验中,我们做出判断时所依据的逻辑是:如果在原假设正确的前提下,检验统原创 2021-10-18 07:10:21 · 869 阅读 · 4 评论 -
什么是信度分析(Reliability)?有哪些信度分析方法?那什么又是效度?
什么是信度分析(Reliability)?信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分原创 2021-10-15 07:08:24 · 2717 阅读 · 5 评论 -
什么是方差分析(ANOVA)?方差分析(ANOVA)有哪些类型?
什么是方差分析(ANOVA)?使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。分类 单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系 多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系 多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系 ...原创 2021-10-15 07:08:49 · 4228 阅读 · 3 评论 -
什么是回归分析(regression analysis)?有哪些类型的回归分析(regression analysis)?
什么是回归分析(regression analysis)?有哪些类型的回归分析(regression analysis)?一元线性回归分析:只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。多元线性回归分析使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。 残差检验:观测值与估计值的差值要艰从正态分布 强影响点判断:寻找方式一般分为标准误差法、Ma...原创 2021-10-16 00:01:25 · 843 阅读 · 3 评论