ML/DL
文章平均质量分 75
-dragon-
越努力,越幸运,不要让任何事成为你不学习的理由!关注数据挖掘、增强现实和android相关领域的发展。
展开
-
LocED-Location-aware Energy Disggregation Framework
LocED:Location-aware Energy Disggregation Framework标签(空格分隔): smartMeters翻译来自论文:LocED:Location-aware Energy Disggregation Framework,仅做学术研究用,限于水平,可能有一些错误,敬请量解,谢绝转载!摘要:提供用电器级的能量消耗信息或是会导致消费者理解他们消费习惯,鼓励他们优化翻译 2015-11-19 14:08:19 · 1615 阅读 · 1 评论 -
凸凹函数的定义
1.凸凹性是函数的性质,也有多方面的应用,特别是在机器学习上,凸凹性的函数不仅在国外有争议,在国内也有不同的叫法,也有些教材会把凸定义为上凸,凹定义为下凸。2.f(x)=lgx是凸函数,根据函数图象判断.一般开口向下的二次函数是凸函数,开口向上的二次函数是凹函数(国外)。3.定义凸函数的定义 假设f(x)在[a,b]上连续,若对于任意的x1,x2∈[a,b],恒有f[(x1+x2)/2]≥[f(x原创 2015-11-26 16:17:45 · 14460 阅读 · 2 评论 -
ML--K-近邻算法
声明:本人学习的机器学习以machine learning in action 【美】peter Harrington著为主,练习上面代码并进行适当修改,不涉及任何版权不作任何商业用途,有问题可以联系本人,文中源码到一定时间将会在github上公开。1、K-近邻算法(k-Nearest Neighbor,KNN)该算法通过测量不同特征之间的距离来进行分类,说的是每个特征可以通过它的最邻近的K个邻居来原创 2015-12-07 21:45:19 · 673 阅读 · 0 评论 -
什么是机器学习,一文让你了解机器学习的历史和真谛
作者:计算机的潜意识在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是 EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完转载 2016-04-13 13:04:07 · 21296 阅读 · 7 评论 -
数据结构之--series,DataFrame.use python and pandas for data mining
1.好的数据结构是数据分析的基础,一个高效的数据分析方法离不开数据的构造,series and DataFrame是两种高效简单的数据类型。2.Series是一个一维的类似的数组对象,包含一个数组的数据(任何NumPy的数据类型)和一个与数组关联的数据标签,被成为索引(index),索引显示在左边,值显示在右边,其中索引在不指定的情况下从0到N-1之间自动产生,N是指数据的长度。l1 = Serie原创 2016-03-27 13:08:07 · 1802 阅读 · 0 评论 -
程序员的十个经典算法
算法一:快速排序算法快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。快速排序使用转载 2016-04-04 09:06:23 · 2729 阅读 · 0 评论 -
Gibbs 采样完整解析与理解
1.gibbs简析: gibbs采样需要知道样本中一个属性在其它所有属性下的条件概率,然后利用这个条件概率来分布产生各个属性的样本值。gibbs采样属于随机模拟抽样算法中的一种(一类近似求解的方法)。随机模拟的核心是对一个分布进行抽样,常用的抽样算法包括:1. 接受-拒绝抽样;2)重要性抽样;3)MCMC(马尔科夫链蒙特卡洛方法)方法,它包括两个非常著名的采样算法(metropolis-hastin原创 2016-03-30 15:34:37 · 69567 阅读 · 6 评论 -
数据挖掘之特征选择
作者: Edwin Jarvis特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通转载 2016-03-30 12:19:21 · 35573 阅读 · 1 评论 -
通用算法(ML,DL)分类判定指标:召回率 Recall、精确度Precision、准确率Accuracy等
1.当用算法实现某一问题后,如何证明算法有效性?如何证明你的算法比别的算法更优。特别是针对二分类问题,下面介绍一下分类标准。2 标准表示分类正确:True Positive:本来是正样例,分类成正样例。True Negative:本来是负样例,分类成负样例。表示分类错误:False Positive :本来是负样例,分类成正样例,通常叫误报。False Negative:本来是正样例,分类成负样例,原创 2016-03-06 14:40:56 · 6103 阅读 · 1 评论 -
EM 算法的推导和解释
原文连接:http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.htmlEM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. J转载 2016-01-11 20:21:39 · 1858 阅读 · 0 评论 -
最新回归算法理解、实现及应用(2)logistic回归
1.该算法的主要思想是:根据现有数据对分类边界线建立回归公式,以此分类(二值分类、也称概率分类)。这里的回归指的最佳拟合,表示要找到最佳的参数集,训练的过程就是寻找最佳参数的过程。2.logistic回归算法(适用数值型和标称型数据)优点:计算代价不高,容易理解和计算。缺点:欠拟合,分类精度可能不高。3.激活函数sigmoid函数是一种阶跃函数,输出范围在[0,1],在回归问题中,我们需要找到最佳的原创 2016-01-27 18:40:03 · 2591 阅读 · 1 评论 -
最新回归算法理解、实现及应用(1)线性回归
一、回归模型间的关系,回归是统计学中最有力的算法之一:1.1 回归:(regression):用已知样本对未知公式参数的估计,给出一个点集D,用一个函数去拟合这个点集,并且使得点集与拟合函数间的误差最小,如果这个函数曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归。1.2.线性回归(linear regression):回归的一种,回归函数是一次函数,例如:f(x,y,z原创 2016-01-22 20:20:17 · 8207 阅读 · 0 评论 -
RNN训练过程详解
Hinton 第七课 。这里先说下RNN有recurrent neural network 和 recursive neural network两种,是不一样的,前者指的是一种人工神经网络,后者指的是一种深度神经网络这里指的是前者,这部分翻译的不好,因为之前没怎么接触过RNN,不过就当理解意境吧,所以附上所有的ppt,看得懂的就看PPt,下面的是附带说明,有些语句没有那么通顺,所以就当意境了。转载 2016-01-08 15:10:08 · 45426 阅读 · 0 评论 -
最新隐马尔可夫模型HMM详解
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。 考虑下面交通灯的转载 2016-01-04 09:47:50 · 16594 阅读 · 2 评论 -
ML--HMM(隐马尔可夫模型及python的实现2)
1.HMM的应用1,这个代码不知道出处了,若有侵权请联系本文作者删除,注释为本人所加。2.对基本的HMM需要进一步了解的,请戳这里3.下面是HMM代码的解释之一# _*_ coding:utf-8 _*_# __author__='dragon'"""test HMM"""from __future__ import divisionimport numpy as npimport ma原创 2016-01-17 22:26:15 · 7308 阅读 · 5 评论 -
ML--HMM(隐马尔可夫模型及python的实现1)
1.综述:隐马尔可夫模型是马尔可夫模型的进一步发展。马尔可夫模型是马尔可夫过程的模型化, 可以用图1 (a) 的框图形象表示。它把一个总随机过程看成一系列状态的不断转移。图1(b)是隐马尔可夫模型。1.1几个需要理解的概念a.马尔可夫性:如果一个过程的”将来”仅依赖“现在”,而不依赖“过去”,此过程具有马尔可夫性,称此过程是马尔可夫过程。 b,马尔科夫链:时间和状态都离散的马尔科夫过程,称为马尔可原创 2015-12-10 13:20:20 · 9370 阅读 · 0 评论 -
排序算法理解浅析
1.排序算法有很多,准确的理解可以帮我们快速实现工程问题,一种是比较排序,时间复杂度最少可达到O(n log n),主要有:冒泡排序,选择排序,插入排序,归并排序,堆排序,快速排序等。另一种是非比较排序,时间复杂度可以达到O(n),主要有:计数排序,基数排序,桶排序等。本文主要介绍比较排序,下表给出了它们的复杂度 。2.快速排序快速排序是由东尼·霍尔所发展的一种排序算法。在平均或是最好的状况下,排序原创 2017-02-21 19:52:56 · 1055 阅读 · 0 评论