自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据挖掘之链接分析学习

链接分析最重要的应用就是搜索引擎,另外,在论文检索、社交网络等方面也有应用。1. 有过哪些链接分析技术?2. PageRank技术的基本定义什么?3. PageRank有哪些改进?考虑了哪些因素?4. 有哪些链接作弊技术?如何消除这些作弊?5. 什么HITS算法?与PageRank的区别是什么?1. 有过哪些链接分析技术?1)倒排索引:第一代搜索技术,将

2013-06-26 14:05:32 4720

原创 数据挖掘之聚类

聚类属于无监督学习。聚类的算法有很多种,其可分为基于划分、层次、密度、网格及模型的聚类方法。根据数据集的不同,需要采用不同的聚类算法和策略。1. 选择聚类算法,所面临的常见问题又哪些?1) 不同形状的数据集。不同形状的数据集,也需要采取不同的度量策略,或者不同的聚类算法。2)不同的数据次序。相同数据集,但数据输入次序不同,也会造成聚类的结果的不同。3)噪声。不同的算

2013-06-24 18:00:11 8076 2

原创 数据挖掘之频繁项集分析

频繁项集最经典和常用的应用就是超市的购物篮分析。每个购物篮里有很多商品,每个商品都是一项元素,每个购物篮都是一个集合,所有购物篮就形成了一个系列集合。分析哪些商品经常一起频繁出现在购物篮内,即找到频繁项集,然后,再分析其他商品与频繁项集的关系,即关联规则。1. 什么是频繁项?什么是频繁项集?与相似性分析有什么差别? 有什么应用?频繁项:在多个集合中,频繁出现的元素/项,就是频繁

2013-06-21 15:58:20 28999 2

原创 数据挖掘之大数据流处理

大数据流 即 实时收集的大量的数据。数据的流量大到无法实时将全部数据放入分析工具中处理。这里写写要解决的问题,及问题解决的思路,若是真的去实现,则需要考虑更多的问题、因素,需要查询更更详尽的资料。常见的数据流问题:1. 数据流的查询有哪些类型?有哪些处理策略?2. 对大数据流进行抽样,带来哪些问题?3. 如何有效地过滤某些数据?4. 对独立(不同)元素的

2013-06-17 10:12:11 17523 4

原创 数据挖掘之相似性度量

机器学习或数据挖掘,就是在数据中寻求答案的算法。而寻求的答案就是训练完成的数据模型。大部分的数据建模方法都属于这两种:1) 数据汇总,对数据进行 简洁的近似描述如pagerank、聚类2) 特征抽取如频繁项集(同时频繁出现的元素子集)、相似项(共同元素比例较高的集合对)在机器学习或数据挖掘之前,还需要概率,或信息论的一

2013-06-08 18:10:11 21633 4

原创 在线机器学习算法及其伪代码

机器学习:需要从已知的数据 学习出需要的模型在线算法:需要及时处理收集的数据,并给出预测或建议结果,并更新模型通用的在线学习算法步骤如下:1. 收集和学习现有的数据2. 依据模型或规则,做出决策,给出结果3. 根据真实的结果,来训练和学习规则或模型常用的在线学习算法:Perceptron: 感知器PA: passive aggressive PerceptronPA-IPA-II...

2013-06-06 17:27:24 20436 1

原创 认识大数据分析

最近关注大数据,读了一些相关的书和文章,这里对自己在大数据概念上做一个总结。1. 大数据是泡沫吗?泡不泡沫有什么关系?大数据很热,热的让人都觉得有问题了。不过,大数据应该是有一定含金量的,否则,没人会炒作它,至于泡沫有多大,要真正了解大数据才知道。泡不泡沫其实跟大数据没关系,大数据就在那,泡沫就只是别人的炒作。泡沫破裂后,大数据可能会暂时被很多企业放在一边,但随着其

2013-06-04 17:40:36 4464 1

原创 fuzzy logic模糊计算的原理

为什么需要 模糊计算? 首先,弄清楚 传统计算的方式:精确的数学语言,定量化分析,无法解决 概念模糊的问题,如大房子,小个子,小伙子等。原因就是 有一些概念模糊的问题,需要模糊计算来处理。模糊计算与普通计算的 明显不同之处在哪里?普通计算,一般是函数式,一一对应的关系。而模糊计算,一个变量,可以对应于多个状态值,当然,这些个状态与普通的函数表示也不是完全相同的,并不是完

2013-06-03 17:16:33 19153

ADASIS v2 接口协议 (Advanced Driver Assistance Systems Interface Specifications )

2012版 ADASIS v2. 1. 详细地描述了汽车周边的地图数据和模型的开放标准,这样,地图数据可以在导航及其他程序间传输。 2. 详细地描述了各种ADAS程序如何能获取车辆位置相关信息,如CAN-bus上的数据,数据传输协议(不包含ADAS RP,ADAS接口数据重构协议)。

2013-01-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除