自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数据挖掘-理论与算法(公开课笔记二)

目录6.1 Clustering 聚类6.1.1 Unsupervised Learning 无监督学习6.2.1 Clustering Algorithm 聚类算法6.3.1 EM Method 期望最大法6.4.1 Density/Hierarchical Based Methods 密度与层次7 Assocation Role 关联规则7.1.1 Assocation Role 关联规则7.2.1 Support&Confidence of Association Role 支持度 置信度7.

2020-08-17 15:41:09 913

原创 数据挖掘-理论与算法(公开课笔记一)

目录2 Data Preprocessing 数据预处理2.1.1 Data Cleaning 数据清洗2.2.1 Outliers & Duplicate detection 异常值与重复检测2.3.1 Type conversion & sampling 类型转换与采样2 Data Preprocessing 数据预处理2.1.1 Data Cleaning 数据清洗获取的数据可能不可用,存在缺数据、数据错误、噪音等问题,这些都会导致程序无法运行。因此在处理之前要进行清洗等操作。

2020-08-11 18:22:46 738

原创 有序/无序分类变量的统计推断

有序/无序分类变量的统计推断1 有序分类变量的统计推断——非参数检验1.1 非参数检验概述1.2 两个配对样本的非参数检验1.3 两个独立样本的非参数检验1.4 多个独立样本的非参数检验1.5 多个配对样本的非参数检验2 无序分类变量的统计推断——卡方检验2.1 卡方检验概述2.2 单样本案例:考察抽样数据的性别分布2.3 两样本案例:不同收入级别家庭的轿车拥有率比较2.4 一致性检验与配对卡方检验2.5 分层卡方检验1 有序分类变量的统计推断——非参数检验1.1 非参数检验概述如果想要检验两个正..

2020-08-04 19:22:47 9985

原创 连续变量的统计推断

连续变量的统计推断1 t检验1.1 t检验概述1.2 成组设计两样本均数的比较1 t检验1.1 t检验概述在针对连续变量的统计推断方法中,最常用的有t检验和方差分析两种,其中t检验是最基本的检验方法。对于X‾\overline{X}X - μ 仅看这一个数字很难判断出这种差异究竟是大是小。为此需要找到某种方式对这一差值进行标准化。标准化的思路是将该差值除以某种表示离散程度的指标。标准化变换:其中,样本均数X‾\overline{X}X的分布规律为正态分布n(μ,σ2/N),U检验看上去虽然很好

2020-08-03 19:19:40 3106

原创 分布类型的检验

分布类型的检验1 假设检验的基本思想1.1 假设检验的标准步骤1.2 假设检验的两类错误2 正态分布检验2.1 K-S 检验的原理2.2 案例3 二项分布检验3.1 二项分布检验的原理3.2 案例4 游程检验4.1 游程检验原理4.2 案例5 蒙特卡罗方法5.1 蒙特卡罗方法原理1 假设检验的基本思想1.1 假设检验的标准步骤小概率事件(发生概率很小,如P<=0.05)小概率反证法原理:对于一个小慨率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试..

2020-08-01 15:58:00 1250

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除