40 机器学习
It_BeeCoder
这个作者很懒,什么都没留下…
展开
-
准确率、召回率、F-score——信息检索、分类、推荐系统评估标准
在分类和推荐系统中,对其结果进行评价,经常用到准确率、召回率、F-score这些指标。下面介绍其概念,举例阐述。准确率(Precision):检索出的相关文档/检索出的文档总数,衡量的是系统的查准率。召回率(Recall):检索出的相关文档/文档中所有相关文档总数,衡量的是系统的查全率。F-score是两者的综合评价标准:准确率和召回率的取值范围都在[0,1],转载 2017-09-28 15:02:37 · 968 阅读 · 0 评论 -
大数据中简化数据的几种方式
大数据处理中,数据量是很庞大的,如果简化数据,便于后期处理,是一项基础工作。下面介绍,可以采用的几种方法。1、主成分分析。根据事先指定的信息量(一般是方差最大的是第一主成分),确定主成分分析的层级。2、SVD(奇异值分解)优势:简化数据,去除噪声,提高算法结果。 在推荐系统的相似度矩阵计算过程中,能够通过SVD从高维降到低维,减少计算量,保障推荐的效果。作转载 2017-09-28 15:04:46 · 2563 阅读 · 0 评论 -
卷积神经网络概念与原理
一、卷积神经网络的基本概念 受Hubel和Wiesel对猫视觉皮层电生理研究启发,有人提出卷积神经网络(CNN),Yann Lecun 最早将CNN用于手写数字识别并一直保持了其在该问题的霸主地位。近年来卷积神经网络在多个方向持续发力,在语音识别、人脸识别、通用物体识别、运动分析、自然语言处理甚至脑电波分析方面均有突破。 卷积神经网络与普通神经网络的区别在于,卷积神经网络包...转载 2018-02-18 23:40:22 · 521 阅读 · 0 评论 -
机器学习中信息增益的计算方法
背景介绍:最近在处理数据的时候,需要用到信息增益来进行特征选择,在网上查阅了一些资料,这里对信息增益的相关知识总结一下。信息增益原理介绍介绍信息增益之前,首先需要介绍一下熵的概念,这是一个物理学概念,表示“一个系统的混乱程度”。系统的不确定性越高,熵就越大。假设集合中的变量X={x1,x2…xn},它对应在集合的概率分别是P={p1,p2…pn}。那么这个集合的熵表示为:举一个的例子:对游戏活跃用...原创 2018-03-14 14:43:32 · 33100 阅读 · 9 评论 -
从多层感知器到卷积网络(二)
上一篇中,我们讲解了什么是MLP以及如何训练得到一个MLP,读者大概对神经网络有一定的印象了。我们总说,好戏在后头,接下来这一大块头,我们将重点介绍卷积网络。何谓卷积单凭卷积这一个称号大概可以吓死一半的普通老百姓了。一开始接触卷积网络的时候,我就差点成了那一半的老百姓,幸好我命大,最终挺过来了。卷积,只依稀记得当年大学概率论稍有提过这样的名词,那时不愿深究,现在胆子大了,没事,维基搞起,卷积定...转载 2018-03-26 11:30:10 · 819 阅读 · 0 评论