自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (5)
  • 收藏
  • 关注

转载 一文看懂卷积神经网络(CNN)

1 人工神经网络1.1 神经元    神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后,最开始只是简单的线性加权,后来给每个神经元加上了非线性的激活函数,从而进行非线性变换后输出。每两个神经元之间的连接代表加权值,称之为权重(weight)。不同的权重和激活函数,则会导致神经网络不同的输出。    举个手写识别的例子,给定一个未知数字,让神经网络识别是什么数字。此时的神经网络的输...

2018-04-28 17:35:47 1737

转载 卷积神经网络中的池化方法(pooling)总结

在卷积神经网络中,我们经常会碰到池化操作,而池化层往往在卷积层后面,通过池化来降低卷积层输出的特征向量,同时改善结果(不易出现过拟合)。为什么可以通过降低维度呢?因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述大的图像,一个很自然的想法就是对不同位置的特征进行聚合统计,例如,人们可以计算图像一个区域上的某个特定特征的平均值 (或最大...

2018-04-28 16:52:35 15781

转载 一文搞懂隐马尔可夫模型(HMM)

什么是熵(Entropy)简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序,意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化,组织化,复杂化状态的一种度量。熵最早来原于物理学. 德国物理学家鲁道夫·克劳修斯首次提出熵的概念,用来表示任何一种能量在空间中分布的...

2018-04-26 11:57:59 831

转载 轻松理解条件随机场(CRF)

理解条件随机场最好的办法就是用一个现实的例子来说明它。但是目前中文的条件随机场文章鲜有这样干的,可能写文章的人都是大牛,不屑于举例子吧。于是乎,我翻译了这篇文章。希望对其他伙伴有所帮助。原文在这里[http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/]想直接看英文的朋友可以直接点进去了。我在翻译时并没有...

2018-04-26 10:18:03 1922

原创 调用多个thrift接口ttypes冲突的问题

我有一个thrift文件,名为importservice.thrift执行命令#thrift --gen py  importservice.thrift生成了一个./gen-py/importservice目录该目录下有一个ImportService.py文件文件开头引入了from thrift.Thrift import TType, TMessageType, TException, TAp...

2018-04-24 17:33:59 2490

转载 KL距离(衡量两个概率分布的差异情况)

KL距离,是Kullback-Leibler差异(Kullback-Leibler Divergence)的简称,也叫做相对熵(Relative Entropy)。它衡量的是相同事件空间里的两个概率分布的差异情况。KL距离全称为Kullback-Leibler Divergence,也被称为相对熵。公式为:感性的理解,KL距离可以解释为在相同的事件空间P(x)中两个概率P(x)和Q(x)分布的差异...

2018-04-24 10:04:56 10275

转载 基于WordNet的英文同义词、近义词相似度评估及代码实现

源码地址:https://github.com/XBWer/WordSimilarity    1.确定要解决的问题及意义在基于代码片段的分类过程中,由于程序员对数据变量名的选取可能具有一定的规范性,在某一特定业务处理逻辑代码中,可能多个变量名之间具有关联性或相似性(如“trade”(商品交易)类中,可能存在“business”,“transaction”,“deal”等同义词),在某些情况下,它...

2018-04-22 21:34:33 4074 1

转载 梯度下降法和最速下降法的细微差别

原文地址:https://blog.csdn.net/Timingspace/article/details/50963564

2018-04-18 16:51:19 969

转载 Computational Learning Theory - VC Dimension

文章地址:http://www.csuldw.com/2016/08/23/2016-08-23-vc-dimentions/#mjx-eqn-3

2018-04-18 15:33:42 383

转载 Bias-Variance Tradeoff解释

原文地址: https://liam0205.me/2017/03/25/bias-variance-tradeoff/

2018-04-18 15:06:30 168

转载 真阳率(true positive rate)、假阳率(false positive rate),AUC,ROC

很早以前就知道这些概念了,不过由于跟自己的认知习惯不一样,所以碰到了还是经常会忘。于是索性把这些概念总结一下,以后再忘了也好找(其他的文章太啰嗦了,计算方法也写的不清不楚….) 另外我也会陆续更新一些其他的机器学习相关概念和指标,即是方便自己,也方便他人吧。注意:本文将混用正负样本和阳性(+)阴性(-)这两套说法真阳率、假阳率这些概念其实是从医学那边引入到机器学习里面的,所以其思维逻辑多多少少会跟...

2018-04-18 10:58:35 75283 9

转载 遗传算法详解(GA)

遗传算法        照例先给出科学定义:       遗传算法(Genetic Algorithm, GA)起源于对生物系统所进行的计算机模拟研究。它是模仿自然界生物进化机制发展起来的随机全局搜索和优化方法,借鉴了达尔文的进化论和孟德尔的遗传学说。其本质是一种高效、并行、全局搜索的方法,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最佳解。      再给出相关术...

2018-04-17 20:38:04 3610

转载 bootstrap, boosting, bagging的区别和联系

Bootstraping: 名字来自成语“pull up by your own bootstraps”,意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法,它是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。其核心思想和基本步骤如下:  (1) 采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。   (2) 根据抽出的样本计算给定的统计量T。...

2018-04-13 14:59:26 501

转载 独立成分分析(Independent Component Analysis)(ICA)(主元分解)

1. 问题:     1、上节提到的PCA是一种数据降维的方法,但是只对符合高斯分布的样本点比较有效,那么对于其他分布的样本,有没有主元分解的方法呢?     2、经典的鸡尾酒宴会问题(cocktail party problem)。假设在party中有n个人,他们可以同时说话,我们也在房间中一些角落里共放置了n个声音接收器(Microphone)用来记录声音。宴会过后,我们从n个麦克风中得到了一...

2018-04-13 11:40:25 2569

转载 PCA(主成分分析)的工作原理

PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。当然我并不打算把文章写成纯数学文...

2018-04-10 20:19:00 395

转载 主成分分析(Principal components analysis)(特征降维)(PCA)-最大方差解释

在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做Principal factor analysis。1. 问题     真实的训练数据总是存在各种各样的问题:1、 比如拿到一个汽车的样本,里面既有...

2018-04-10 17:11:51 1116

转载 分类算法-K近邻

最近在看《机器学习实战》这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,就在朋友的推荐之下选择了这本书进行学习。 一 . K-近邻算法(KNN)概述     最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多...

2018-04-09 15:25:42 589

转载 聚类算法-K均值(K-means)

摘要      在前面的文章中,介绍了三种常见的分类算法。分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法。聚类属于无监督学习,相比于分类,聚类不依赖预定义的类和类标号的训练实例。本文首先介绍聚类的基础...

2018-04-09 15:17:59 7263 1

转载 机器学习-Adaboost 算法(集成学习)

本文结构:什么是集成学习?为什么集成的效果就会好于单个学习器?如何生成个体学习器?什么是 Boosting?Adaboost 算法?什么是集成学习集成学习就是将多个弱的学习器结合起来组成一个强的学习器。这就涉及到,先产生一组‘个体学习器’,再用一个策略将它们结合起来。个体学习器可以选择:决策树,神经网络。集成时可以所有个体学习器属于同一类算法:全是决策树,或全是神经网络;也可以来自不同的算法。结合...

2018-04-09 12:00:13 706

转载 神经网络-反向传播算法

一、前言这是一场以误差(Error)为主导的反向传播(Back Propagation)运动,旨在得到最优的全局参数矩阵,进而将多层神经网络应用到分类或者回归任务中去。前向传递输入信号直至输出产生误差,反向传播误差信息更新权重矩阵。这两句话很好的形容了信息的流动方向,权重得以在信息双向流动中得到优化,这让我想到了北京城的夜景,车辆川流不息,车水马龙,你来我往(* ॑꒳ ॑* )⋆*。至于为什么会提...

2018-04-07 16:45:08 618

原创 ElasticSearch通过Scroll方式遍历索引(Python代码)

当我们要查询的数据量过大的时候,用es的from+size的方式会报错,会提示你from+size不能大于10000那么可以用es的scroll方式,实际是一种深度分页机制直接上代码:#-*- coding:utf8 -*-from elasticsearch import Elasticsearch, helpersimport jsonimport pdbclass Elastic...

2018-04-04 17:50:04 8517 1

转载 最小二乘法

定义:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。准备工作:在理解最小二乘法之前,需要提前了解三个数学知识(假设数学已经还给生物老师的情况下)三项式平方展开:(x+y+z)^2 可以看作是((x+y)+z)^2 就是把三项式转化为二项式一次函数:在某一个...

2018-04-04 09:49:24 819

转载 分类算法之决策树

摘要      在前面两篇文章中,分别介绍和讨论了朴素贝叶斯分类与贝叶斯网络两种分类算法。这两种算法都以贝叶斯定理为基础,可以对分类及决策问题进行概率推断。在这一篇文章中,将讨论另一种被广泛使用的分类算法——决策树(decision tree)。相比贝叶斯算法,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。决策树引导      通俗来...

2018-04-02 15:47:19 355

mysql-5.1.69.tar.gz

mysql-5.1.69.tar.gz mysql数据库源码。

2013-09-10

httpd-2.2.20.tar.gz

httpd-2.2.20.tar.gz,apache服务器源码

2013-09-10

apache+php+mysql的嵌入式移植详细过程

这篇文档是apache+php+mysql的嵌入式移植详细过程。是本人整个移植过程的经验总结,包含了移植过程中出现的问题的解决方法

2013-09-10

arm-linux-gcc-4.4.3.tar.gz

arm-linux-gcc-4.4.3.tar.gz

2013-09-07

apache+sqlite+php的嵌入式移植

这里面包含了apache,php,sqlite详细的嵌入式移植步骤。

2013-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除