机器学习理论
小松悦读会 | kevinelstri
小松悦读会,用心阅读,执着专注!
展开
-
【机器学习理论】第6部分 准确率Accuracy,精确度Precision,召回率Recall,F-Score
准确率和召回率是用于信息检索和统计学分类领域的两个度量值,用于评价结果的质量,在机器学习中对于数据进行预测的过程中,同样的使用这些指标来评价预测的结果的质量。 准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率; 召回率是指检索出的相关文档数和文档库中的所有的相关文档数的比率,衡量的是检索系统的查全率。 1. 正确率 = 正确识别原创 2017-03-09 14:15:39 · 8208 阅读 · 0 评论 -
【机器学习理论】第3部分 聚类分析
1、概述聚类分析可以应用到多个领域中,在生物学中,聚类可以辅助动植物分类的研究,可以通过对基因数据的聚类,找出功能相似的基因;在地理信息系统中,聚类可以找出具有相抵用途的区域,辅助石油开采;在商业上,聚类可以帮助市场分析人员对消费者的消费记录进行分析,从而得出消费者的消费模式,实现消费群体的区分。聚类就是将数据对象分组成多个类簇,划分的原则就是使得同一个簇内的对象之间具有较高的相似度,而不同簇之间对原创 2016-12-24 14:17:03 · 6076 阅读 · 0 评论 -
【机器学习理论】第4部分 凸函数
凸函数一直是一个头疼的事,并不是凸函数有多难,而是凸函数的定义一直是个模棱两可的概念,为了方便记忆,现在对凸函数及其相关定义进行总结。凸函数图像: 由函数图像更加清晰地辨别凸函数的形状,然后对定义的认识才能更加的清晰。凸函数定义: 为函数f(x)定义域内的任意两个实数,且,恒有 ,则称f(x) 是定义域上的凸函数。凸函数的判定: f(原创 2016-08-23 19:56:39 · 14207 阅读 · 2 评论 -
【机器学习理论】第5部分 微积分基础
1、两边夹定理如果函数![这里写图片描述](http://img.blog.csdn.net/20161121152943052)满足下列条件:(1)当时![这里写图片描述](http://img.blog.csdn.net/20161121152954657),有![这里写图片描述](http://img.blog.csdn.net/20161121153004552)(2)当时,有,那么当原创 2016-11-21 16:22:45 · 640 阅读 · 0 评论 -
【机器学习理论】第1部分 机器学习基础
对于机器学习算法也使用了一段时间,现在进行一个系统的学习和总结,也给自己补缺补差,回头来看,发现对于机器学习的理解更加的清晰,更加有条理,在整体的思路上的把握也更加的完善,所以建议对于机器学习的学习一定要多实践,多回头查看、【分类介绍】监督学习:在监督学习中,我们只需要给定输入样本集,机器就可以从中推测出指定目标变量的可能结果。监督学习使用两种类型的目标变量:标称型和数值型。标称型:其目标变量的结原创 2016-12-15 10:08:10 · 2548 阅读 · 0 评论 -
【机器学习理论】第2部分 相关性度量
不管是在机器学习算法中,还是数据挖掘算法中,相似性的度量都是一个非常重要的概念。 在聚类算法中,利用样本之间的相似度进行将样本进行划分成不同的类别; 在搜索引擎中,当输入关键词时,是利用关键词与网络信息之间的相似度来产生结果的,使得搜索引擎产生的信息能够符合用户的需要; 在推荐系统中,同样是利用相似性来为用户推荐可能需要的信息,满足用户的需求。相似度距离计算可以分为很多种,下面进行详细的描述:原创 2016-12-15 14:33:18 · 4038 阅读 · 0 评论 -
【机器学习理论】第7部分 决策树算法ID3,C4.5算法
一、引言 在最开始的时候,我本来准备学习的是C4.5算法,后来发现C4.5算法的核心还是ID3算法,所以又辗转回到学习ID3算法了,因为C4.5是他的一个改进。至于是什么改进,在后面的描述中我会提到。 二、ID3算法 ID3算法是一种分类决策树算法。他通过一系列的规则,将数据最后分类成决策树的形式。分类的根据是用到了熵这个概念。熵在物理这门学科中就已经出现过,表示是一个物质的稳定度,在这里就是原创 2016-08-09 19:12:25 · 1101 阅读 · 0 评论 -
【机器学习理论】信息熵
熵可以理解为信息量,而信息量又可以理解为随机性。若不确定性越大,则信息量越大,熵越大;若不确定性越小,则信息量越小,熵越小。熵的计算公式: 一个系统越是有序,信息熵就越低;一个系统越是混乱,信息熵就越高。原创 2016-09-28 10:20:12 · 755 阅读 · 0 评论