自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【读书笔记】统计学:从数据到结论 第十一章

第十一章 聚类分析    聚类是一个把数据对象集划分成多个组或簇的过程,使得簇内的对象具有很高的相似性,但与其他簇中的对象很不相似。    对于聚类方法的分类,有以下几种:基于划分的聚类:把数据划分为k个组,使得每个组至少包含一个对象。大部分划分方法是基于距离的,给定要构建的分区数k,首先创建一个初始划分,然后采用一种迭代的重定位技术,通过把对象从一个组移动到另一个组来

2015-12-10 15:43:08 1111

原创 【读书笔记】统计学:从数据到结论 第十章

第十章 主成分分析和因子分析   当变量很多,且有些变量是相关的时候,为了找出少数能够代表它们的变量,就要用到主成分分析和因子分析,所以,主成分分析和因子分析都是用来降维的。主成分分析    假定原先数据是二维观测值,在一个二维坐标系中,这些数据点形成一个有椭圆形轮廓的点阵,这个椭圆有两条轴,一条长轴和一条短轴,互相垂直,长轴承担了数据比较多的变化,代表了数据包含的大部

2015-12-07 20:42:18 667

原创 【读书笔记】统计学:从数据到结论 第九章

第九章 方差分析    方差分析又称F检验,是t检验的一种扩展,t检验就是之前在第六章提到过的,总体呈正态分布,均值呈t分布时计算p-value,看p-value是否足够小的检验。F检验与t检验不同的是,t检验适合于两个变量均数间的差异检验,多于两个变量间的均数比较适合于用方差分析,而且方差分析要求自变量至少有一个是定性变量。    方差分析的原理是:因变量的值随着自变量的不同取值

2015-12-06 20:26:46 690

原创 【读书笔记】统计学:从数据到结论 第八章

第八章 列联表、χ²检验和对数线性模型     列联表是观测数据按两个或更多属性分类时所列出的频数表,如图是一个三维的列联表,每一个数字代表相应的水平组合出现的频数。卡方检验    研究列联表的一个主要目的就是看这些变量是否相关,零假设是“变量1和变量2不相关”,对于两个定类变量而言,这里的检验统计量通常是计算观测频数与期望频数的差,这种差值用一个卡方统

2015-12-06 16:01:54 622

原创 【读书笔记】统计学:从数据到结论 第七章

第七章  相关和回归分析    统计可以根据目前所拥有的信息来建立人们所关心的变量和其他有关变量的关系,这种关系一般称为模型。加入用Y表示感兴趣的变量,用X表示其他可能与Y有关的变量,则需要建立一个函数关系Y=f(X),这里Y称为因变量或响应变量,X称为自变量也叫解释变量或协变量,建立这种关系的过程就叫做回归。    怎样发现定量变量有没有关系?最简单直观的办法就是画出它们的散点图

2015-12-05 16:11:18 1467

原创 【论文笔记】T-Finder-A Recommender System for Finder Passengers and vacant Taxis

文章研究了一个系统,针对于两个不同的人群,分别是出租车司机和乘客,对于出租车司机而言,为他们提供最好的停靠点或是最容易在巡航中等到乘客的路段,对于乘客而言,为他们提供最好的停靠点或路段,以便能够更方便的打到出租车。    主要做了以下几方面的研究:生成停靠点;路段生成的聚类方法;出租车载到乘客的概率计算方法;乘客在时间阈值内等到出租车的概率计算方法。    一、生成

2015-12-03 19:32:53 648

原创 【读书笔记】统计学:从数据到结论 第六章

第六章 简单统计推断:总体参数的假设检验    企图肯定什么事物很难,而否定却相对容易得多。    假设检验是一种方法,目的是为了决定一个关于总体特征的定量的断言是否真实。我们通过从总体中抽出的随机样本来计算适当的统计量来检验一个假设,如果我们得到的统计量的实现值在假设为真时是小概率事件,那我们有理由拒绝这个假设。    在假设检验中,先要设立一个原假设,利用人们掌握的反映现实

2015-12-02 23:40:23 1545

原创 【论文笔记】Mining Association Rules in Spatio-Temporal Data

Mining Association Rules in Spatio-Temporal Data:An Analysis of Urban Socioeconomic and Land Cover Change    文章利用关联规则挖掘方法探索科罗拉多州丹佛市的社会经济指标和土地利用变化之间的关系,探讨了怎样从时空数据中挖掘出关联规则,实际上这个研究并没有考虑时间,仅仅考虑了空间

2015-12-01 21:23:52 734

原创 【读书笔记】统计学:从数据到结论 第五章

第五章 简单统计推断:总体参数估计        从数据得到关于现实世界的结论的过程就叫做统计推断,估计是统计推断的重要内容之一,统计推断的另一个主要内容是假设检验。    在利用样本中的信息来对总体参数进行推断之前,人们往往对代表总体的变量假定了分布族,比如假定人们的身高属于正态分布族,这些模型假定基本上是根据经验而得,仅仅是对现实世界的一个近似。模型假定之后,就要确定模型参数,

2015-12-01 15:57:29 1479

原创 【论文笔记】利用事件影响域挖掘时空关联规则

目前,针对时态和空间数据挖掘的研究文献很多,但是综合考虑时态和空间下研究时空关联规则尚没有经典成果,现有的时空关联规则挖掘方法是通过构造事务表,并在事务表中挖掘时空关联规则。    构造事务表的方法大致可以分为基于时空关系和基于时空划分的方法。    基于时空关系的方法主要是考虑时空目标间的时空关系来构建事务表;基于时空划分的方法是将时空区域划分为若干相同大小的单元格,然后在每个单元格里构

2015-11-30 16:59:41 1645

原创 【论文笔记】A Foundational Approach to Mining Itemset Utilities from Databases

这是2004年的一篇讲高效用项集挖掘的论文,算是一篇科普性的文章。 文章介绍了效用值的计算方法,但是是在超市购物的背景下的,分为一个事务效用值和额外效用值,事务效用值是在事务表中体现出来的,文中给出的是超市购物的事务表(表一),表中每一个Item下的数字表示在该事务中购买的量,例如T1事务中,Item A购买了一个,Item B购买数量为0,Item C购买数量为1,Item D购

2015-11-23 11:30:27 489

原创 对遗传算法理解

对简单遗传算法自己的理解

2015-08-08 11:39:36 694

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除