- 博客(7)
- 收藏
- 关注
原创 机器学习学习笔记3---感知机
感知机一、感知机(perceptron)模型这里先讲一些题外话,机器学习其实就是建立模型,通过一部分数据也就是所谓的训练集来构造函数模型,构造好就可以对新的输入实例进行直接分类,感知机模型自然也不例外。1.感知机是神经网络和支持向量机的基础。 感知机属于分类模型,感知机模型其实就是对数据进行分类。所以,依据什么来分类?这是一个最关键的问题,感知机模型最重要的就是建立这个
2017-11-06 15:44:21 1074
原创 机器学习学习笔记2---k邻近算法的实现
k近邻算法的实现一.k近邻算法的内容k近邻算法(k-nearest neighbor,k-NN) 作用:用来基本分类和实现回归 内容:给定一个训练数据集,对新的输入实例,在整个训练数据集中找到与该输入实例最近的k个实例,这k个实例的最多数属于哪个类,就把该输入实例分为这个类。 三要素:1.距离度量:何为最近?距离最近,如何确定距离最近?生活中最常使用的是欧式距离,另
2017-10-28 09:35:37 342
原创 机器学习学习笔记1
1支持向量机:这个名字强调了此类学习器的关键是如何从支持向量构建出解,同时也暗示其复杂度与支持向量的个数有关。2支持向量机的一个重要性质:训练完成后,大部分的训练样本都不需保留,最终模型仅与支持向量有关。
2017-10-10 15:47:44 242
原创 数据挖掘概念与技术第三版 范明 孟晓峰译 第四章习题答案
4.1查询驱动的方法需要复杂的信息过滤和集成处理,这种方法是低效的,并且对于频繁的查询,开销可能很大。而更新驱动将来自多个异构源的信息预先集成,并存储在数据仓库中,供直接查询和分析,并且还支持复杂的多维查询,优势明显,因此更获得工业界的青睐。 很明显,当异构数据库数量较少时,查询开销本来就不大,查询驱动的方法就很容易进行查询分析,而构建数据仓库的代价依然很大,再使用更新驱动就得不偿失了
2017-10-05 17:11:21 10014
原创 数据挖掘概念与技术第三版 范明 孟晓峰译 第四章 数据仓库与联机分析处理学习笔记
1.数据仓库:一个数据集合,四个特点:面向主题的(指面向具体应用)、集成的(指是多个数据库数据集成在一起)、时变的(数据来自历史多个时间范围)、非易失的(分离存放数据,不需要事务处理,数据不容易丢失)。2.联机事务处理(OLTP)与联机分析处理(OLAP)的最原始区别: OLTP面向顾客,主要用于对单条数据的增删改查操作;OLAP面向市场,主要是对集中的大量数据进行分析处理。3.元数
2017-10-04 15:04:06 1264
原创 数据挖掘概念与技术第三版 范明、孟晓峰译 第三章习题答案
3.1 例子:相对于一个80%地址正确的数据库,市场分析人员要使用数据进行目的营销,对数据的准确性总体上还能接受;但对于销售人员来说,要利于数据进行一对一推销,对这样的数据则完全不能接受。 可信性:反映用户信赖的数据规模; 可解释性:反映数据是否容易理解。3.2 处理元祖属性缺失值的方法:1忽略此元祖:适合于多属性缺失;2人工填写缺失值:数据量较小时;3使用一个
2017-10-03 08:53:21 8152 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人