小屁猴多看书-CSDN博客

原创 Tensorflow-gpu & Object Detection API & Tensorflow Serving 配置过程

系统环境：Centos 7.3（ubuntu大同小异，亲测Ubuntu16.04）Nvidia 驱动1.安装kernel yum -y install gcc kernel-devel kernel-headers2.导入公共密钥 rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org3.安装ELRepo rpm ...

2018-10-24 16:28:47 824

原创 TensorFlow Object Detection API 超详细教程和踩坑过程（数据准备和训练）

1.准备数据 object detection的数据是需要tfrecord格式的，但是一般我们还是先制作voc格式的数据更加方便。 1.voc格式数据的准备：github上下载一个label-img：然后选择VOC格式，开始漫长的数据标注过程，标注之后的数据会多一个xml文档，一般在标注之前就按照VOC2012的标准建立文件，你可以去下载VOC2012数...

2018-09-23 18:21:52 18735 18

原创 Tensorflow搭建Alexnet网络（一）

第一部分讲解网络的构建，建立的方式和Tensorflow的官方中文教程的方式略微不同，由于网路结构小，各个隐层并未放入命名空间中，但逻辑顺序依然一样。1.Alexnet 用一张图先展示一下CNN的经典网络结构Alexnet，可以看出它由五层卷积、三层池化和两层全连接组成，我会在网络中加入BN层。2.TensorFlow运作方式 1.输入与占位符（Inputs a...

2018-08-12 15:02:56 906

原创 TensorFlow Object Detection API 超详细教程和踩坑过程（安装）

目录1.配置环境 cuda安装 cudnn安装 anaconda安装并创建环境 tensorflow环境 2.API安装 Tensorflow.models下载 Protobuf配置与测试1.配置环境首先说一下我的环境：Ubuntu16.04 + nvidia384 + cuda9.0 + cudnn...

2018-09-23 16:40:19 14155 11

原创字符串排列组合问题

1.组合求一个字符串的所有能组合的情况，如ABC的所有的组合为A、B、C、AB、AC、BC、ABC，即，举一个例子，从ABC中选出n=2个不同的字符有哪些选法？从A遍历到C，如果选了A就从剩下的BC中再选出一个字符即可，如果没选A，则需要从BC中选出两个字符，这就符合递归的思想，递归的出口自然就是当n减至零，递归公式为： ...

2018-09-03 14:19:54 1557

原创递归与分治

1.递归递归思想是把问题转化为规模缩小了的同类问题的子问题，然后递归调用函数（或过程）来表示问题的解；一个过程(或函数)直接或间接调用自己本身，这种过程（或函数）叫递归过程（或函数）。 1.特点：（1）递归就是在过程或函数里调用自身。（2）在使用递归策略时，必须有一个明确的递归结束条件，称为递归出口。（3）递归算法解题通常显得很简洁，但递归算法解题的...

2018-09-01 16:51:27 491

原创用HMM实现中文分词

1.jieba分词 jieba分词的三种分词模式：精确模式，试图将句子最精确地切开，适合文本分析；全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。 jieba分词的三种算法：基于Trie树结构实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的...

2018-08-13 23:47:58 3132

原创 Tensorflow搭建Alexnet网络（二）

1.训练网络 1.session：完成全部的构建准备、生成全部所需的操作之后，我们就可以创建一个tf.Session，用于运行图表，也可以利用with代码块生成Session，限制作用域：with tf.Session() as sess: 2.生成会话之后，所有tf.Variable实例都会立即通过调用各自初始化操作中的sess.run()函数进行初始化。init = tf.i...

2018-08-12 17:15:00 316

原创最优化算法（三）：PSO

1.介绍我这里就不去生动形象的举什么鸟类捕食的例子了，直接给出流程，基本的粒子群算法很简单，只用明确它每次迭代优化的方法就好了。同样PSO也是一个无约束的迭代求解的最优化算法，我们的目标是(这里的min只是举例子，真实情况不一定是求最小值，可能是求一个特定的f(x))： ...

2018-08-05 18:40:46 2062

原创最优化算法（二）：牛顿法

1.推导牛顿法和拟牛顿法是求解无约束最优化问题的常用方法，它们比梯度下降收敛更快。考虑同样的一个无约束最优化问题：其中f(x)具有二阶连续偏导数的性质，如果k次迭代值为，则可进行二阶泰勒展开： ...

2018-08-05 16:21:26 3827

原创最优化算法（一）：梯度下降法

1.介绍梯度下降法的目标是：，要找到一个使得目标成立，一般选取初值然后不断迭代，更新x的值，直到收敛，那更新的方向就是函数的负梯度方向，因为这样函数下降的最快，这也就是为什么较梯度下降算法的原因。必须具备一个条件，就是一阶连续可导，我们把它在第k次迭代方向上进行泰勒一节展开： ...

2018-08-05 15:36:26 2288

原创强化学习（二）：Sarsa

Sarsa(state-action-reward-state_-action_)1.与Q_Learning的区别 Sarsa是on-policy，即在线学习型，下一个 state_和action_ 将会变成他真正采取的 action 和 state；Q_Learning是off-policy，即离线学习型，state_和 action_ 在算法更新的时候都还是不确定的。这种不同之处...

2018-08-04 18:08:13 770

原创强化学习（一）：Q_Learning

1.强化学习的基本概念Agent：也就是强化学习需要学习的对象。 Stage：就是指当前agent所处的状态。 Action：对Agenti执行什么动作。 Reward：一个Action返回的奖赏值。 Policy：就是从state到action的映射，分为确定策略和与随机策略。2.分类model_free：不熟悉环境，根据reward选择下一步的action（Q.Learnin...

2018-08-04 13:55:24 415

原创机器学习方法总结（十一）：降维分析

降维分析1.降维方法缺失值比率：该方法的是基于包含太多缺失值的数据列包含有用信息的可能性较少。因此，可以将数据列缺失值大于某个阈值的列去掉。低方差滤波：该方法假设数据列变化非常小的列包含的信息量少，因此，所有的数据列方差小的列被移除。高相关滤波：对于数值列之间的相似性通过计算相关系数来表示，对于名词类列的相关系数可以通过计算皮尔逊卡方值来表示。相关系数大于某个阈值的两列只保留...

2018-08-03 15:33:57 518 1

原创机器学习方法总结（十）：条件随机场

条件随机场（CRF）这里只做理论总结，至于它用于NLP中的序列标注会另讲。1.马尔科夫随机场马尔可夫性质：它指的是一个随机变量序列按时间先后关系依次排开的时候，第N+1时刻的分布特性，与N时刻以前的随机变量的取值无关。马尔科夫随机场中：一个无向图组成，图的顶点u在状态a的概率只依赖顶点u的最近临界点，并且顶点u对途中的其他任何节点都是条件独立的，由此构成了顶点u的最近邻节点集...

2018-08-02 20:33:23 322

原创机器学习方法总结（八）：EM

EM算法（Expectation-Maximum）1.引入这个算法的过程我认为李航的统计学习方法讲的很好，所以我就顺着他的思路理一遍然后讲清楚中间的过程。EM算法是一个含有隐变量和观测变量用极大似然估计法估计参数并进行迭代改进参数的生成方法，每次迭代分为两步，E步（Expectation）用极大似然估计得到参数的期望值，M步（Maximum）求出此时参数新的估计值，最大化似然函数。...

2018-08-02 19:35:13 222

原创机器学习方法总结（九）：HMM

HMM(Hidden Markov Model) 这篇文章会讲解HMM的理论知识，在自然语言分类中会有它用于中文文本分类的实例代码1.基本概念隐马尔科夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫随机生成不可观测的状态随机序列，再由各个状态生成一个观测状态从而产生观测随机序列的过程。举一个小例子，假设有四个盒子，每个盒子（状态序列）中都装有红白两种颜色的球，但它们...

2018-08-02 17:53:15 478

原创机器学习方法总结（七）：朴素贝叶斯

朴素贝叶斯1.简介朴素贝叶斯法是典型的生成学习方法，生成方法由训练数据得到联合概率分布P(X,Y)和先验概率P(X)，在训练的过程中求得后验概率P(Y|X)，即：P(X,Y)=P(Y|X)P(Y)，在测试时去求P(X|Y),而前几篇文章介绍的算法都是基于判别的模型，直接去拟合后验概率，注意这里为什么要叫朴素贝叶斯，朴素的原因就是因为它的特征都是独立不会互相影响的。2.流程 ...

2018-08-01 16:56:42 283

原创机器学习方法总结（六）：集成学习

集成学习（Ensemble Learning）1.集成学习的分类Bagging：Bagging是由多个弱学习器集成起来的强学习器，但弱学习器之间没有依赖关系，可以并行生成，简单来说就是每个弱学习器学习数据的一部分特征，然后测试的时候根据结合策略就能得到一个数据总体特征然后分类。Bagging是基于自助采样法（bootstrap sampling）：给定包含m个样本的数据集，先随机取出一个样...

2018-08-01 14:51:34 420

原创机器学习方法总结（五）：决策树

决策树1.决策树的模型和学习策略定义：分类决策树模型是一种描述对实例进行分类的树形结构，由节点和有向边组成，建立时由由不同的特征决定每层的分类依据，分类时，从根节点对每个实例进行测试并分配到子节点，直到分类到叶节点。学习策略：决策树的学习本质上是从训练数据集中归纳出一组分类规则，最后得到一个与训练数据集矛盾较小同时泛化能力较强的决策树；从另一角度，决策树是由训练数据集估...

2018-07-31 11:37:39 282

原创机器学习方法总结（四）：支持向量机

支持向量机1.简介支持向量机（SVM）是一种二分类模型，它的基本形式是定义在特征空间上的间隔最大的线性分类器，这也是它区别于感知机的原因，如果加上核技巧，SVM实际上就变成了一种非线性分类器。它的学习策略是：间隔最大化；求解算法是：凸二次规划的最优化算法。根据数据分布形式分为：线性可分支持向量机、线性支持向量机、非线性向量机。核函数：当输入空间X为欧式空间或离散空间，特征...

2018-07-25 19:28:39 1015

原创机器学习方法总结（三）：K-近邻

K-近邻算法1.流程三要素：距离度量、K值、分类决策规则。输入：，xi是实例的特征向量，yi是实例的类别。输出：实例x所属的类y。根据给定的距离度量，在训练集T中找到与x最临近的k个点，涵盖这k个点的邻域记为Nk(x)。在Nk(x)中根据分类决策规则（类别的众数）找出类别： 2.优缺点...

2018-07-20 12:41:55 292

原创机器学习方法总结（二）：线性回归模型

线性回归模型1.线性回归优点：建模速度快、计算量小、系数容易理解和解释。缺点：模型容易欠拟合、对异常值敏感。原理：对给定数据集,其中,,d为特征维度，m为样本数量，即找到一个线性模型拟合之间的关系，以最简单的例子：用拟合yi，找到一个合适的w和b。求解策略：最小二乘法即基于均方误差最小化的思想进行求解，使得找到一条直线，样本中所有的点到直线的欧氏距离之和最小。求解方法：梯度下...

2018-07-19 14:49:23 898

原创机器学习方法总结（一）

机器学习方法概论说明：本教程的主要目的是个人秋招复习，适用于一些有基础的同学进行复习，主要来自于对统计学习方法和西瓜书的整理，所以不适用于系统学习，详细内容大家可以看书。其中加入个人的理解和各个算法是实例，由于理解不够导致的错误还请各位指出。 1.特点与分类 1.统计学习方法是基于数据构建概率统计模型并运用模型进行预测与分析。 2.统计学习方法可分为监督学...

2018-07-18 11:50:56 1265

原创神经网络用于股市分析

从神经网络到循环神经网络再到LSTM股市预测一、前言本篇文章是用来做大作业的，会讲到神经网络基础、逆反馈算法推导、循环神经网络和LSTM基础（这里关于LSTM是参考【1】）以及它们的用于股市预测的实例。神经网络（NeuralNetworks）是一种用训练数据拟合目标函数的黑箱模型，只要数据量足够大，它可以拟合出输入到输出之间的任意函数关系，这在原理上是比较难解释...

2018-05-31 16:46:08 9303 2

原创卷积神经网络基础和网络结构

一、发展历史卷积神经网络（Convolutional Neural Network）是一种常见的用于图像分类的深度学习框架，它可以看作是一种对输入信号逐层加工，最后将联系并不密切的输入和输出信息连接起来的分类网络。CNN的网络结构的起源是LaNet5（包含了卷积、池化和非线性的激活函数以及多层感知机模型），之后在2012年Alex Krizhevsky提出了一种AlexNet网络结...

2018-05-23 23:14:27 5700

qq_38593211的博客