RosebudTT-CSDN博客

原创机器学习之LSTM

相比RNN只有一个传递状态，LSTM有两个传输状态，一个 cell state，和一个 hidden state。（Tips：RNN中的 h对于LSTM中的c ）首先使用LSTM的当前输入和上一个状态传递下来的拼接训练得到四个状态。LSTM内部主要有三个阶段：1. 忘记阶段。这个阶段主要是对上一个节点传进来的输入进行选择性忘记。简单来说就是会 “忘记不重要的，记住重要的”。具体来说是通过计算得到的（f表示forget）来作为忘记门控，来控制上一个状态的哪些需要留...

2020-08-09 13:29:33 2163

原创机器学习之隐士马尔科夫链简介

隐马尔可夫模型是关于时序的概率模型组成：初始概率分布，状态转移概率分布，观测概率分布Q：所有可能状态的集合，V：所有可能观测的集合，I: 长度为T的状态序列，O：对应的观测序列A：状态转移概率矩阵，B：观测概率矩阵，三要素1.概率计算问题2.学习问题3.近似问题...

2020-08-06 18:58:09 422

原创机器学习之adaboost

AdaBoost的起源和基本概念adaptive boosting•在概率近似正确（probably approximately correct, PAC)学习的框架中，一个概念（类），如果存在一个多项式的学习算法能够学习它，并且正确率很高，称这个概念是强可学习的；•一个概念（类），如果存在一个多项式的学习算法能够学习它，学习的正确率仅比随机猜测略好，则称这个概念是弱可学习的。•在PAC学习的框架下，一个概念是强可学习的充分必要条件是这个概念是弱可学习。•只要找到一个比随机猜测略好的弱学

2020-07-24 19:32:53 333

原创机器学习之决策树

5.21

2020-07-24 17:46:18 195

原创机器学习之logistic回归与最大熵模型

5.22

2020-05-30 15:30:24 428

原创通信中名词解释

RE（Resource Element）资源元素，或资源粒子。是LTE物理资源中最小的资源单位；在时域上占用1个OFDM Symbol（1/14 ms），频域上为1个子载波（15KHz）。平常所说的符号，即调制后的数据符号，是映射到RE上的，与OFDM 符号是两个不同的概念；RB（Resource Block），资源块。1RB=72RE。在频域上为1个timeslot（0.5ms，半个子帧时间长度，常规CP对应7个OFDM 符号），在频域上为12个子载波（180KHz）。通过RB的时频域不难看出，1RB

2020-05-25 12:21:01 1740

原创机器学习之无监督学习简介

无监督学习的基本想法是对给定数据（矩阵数据）进行某种“压缩”，从而找到数据的潜在结构。假定损失最小的压缩得到的结果就是最本质的结构。•考虑发掘数据的纵向结构，把相似的样本聚到同类，即对数据进行聚类•考虑发掘数据的横向结构，把高维空间的向量转换为低维空间的向量，即对数据进行降维。•同时考虑发掘数据的纵向与横向结构，假设数据由含有隐式结构的概率模型生成得到，从数据中学习该概率模型。概率模型表示为条件概率分布无监督模型三要素：•模型•函数，条件概率分布，或条件概...

2020-05-23 17:48:47 360

原创实用英语写作

英语写作的目的可以是为了某一个考试，但是当你认识到写作是一种思考方式，一种培养逻辑思维的方式时，写作才会真正的提高。从词汇的多样到短语的精悍到句子的复杂到段落之间的逻辑，不同的题材有不同的写作要求。但最重要的还是要多看多思考。一.层次结构英语句子写作1.学会扩展句子。并列句，从句，形容词等等。还是要以简单句意为基本想清楚再去做扩展。在追求高级句式的同时会用标点，不忘句意。2.注意不要让句子出错。高中学过的许多关于单复数的运用，关于句子结构完整性的体会，关于标点符号的使用要明晰。段落写作

2020-05-22 17:31:40 378

原创 python基础知识简版（学习笔记）

一.数据类型1.列表：app=['abc','zty']索引-1指向最后一个元素，-2倒数第二在列表末尾添加元素：append('…') 任何位置插入insert(2,'…') extend（）对于列表的操作主要实现的是对于特定列表的扩展和增长，可以一次添加多个元素，不过也只能添加在列表的最后； m.extend([元素A，元素B，……]删除元素del mortor[1] mortor.pop(n)删除第n个元素，A= mortor.pop...

2020-05-22 17:08:37 245

转载机器学习里的自编码器及应用

自动编码机（简称自编码器）是前馈非循环神经网络，是一种无监督机器学习方法，具有非常好的提取数据特征表示的能力，它是深层置信网络的重要组成部分，在图像重构、聚类、机器翻译等方面有着广泛的应用。自动编码机的一个非常好的应用是降维，也可用于特征提取、文档检索、分类和异常检测。自动编码机的目标是重构一样的输入，其神经元的状态是确定性的可以将自动编码机看作由两个级联网络组成，第一个网络是一个编码器，负责接收输入 x，并将输入通过函数 h 变换为信号 y，第二个网络将编码的信号 y 作为其输入，通过函数f得到重

2020-05-20 18:15:07 2471

原创机器学习之SVM

请

2020-05-20 14:24:02 676

转载强化学习之Actor-Critic

Actor-Critic方法合并了Value-based (比如 Q learning) 和 Policy-based (比如 Policy Gradients) 两类强化学习算法

2020-05-19 17:41:28 1100

转载强化学习之policy gradient

qo

2020-05-19 16:35:38 592

转载强化学习之Monte Carol

这篇文章就用MC方法来玩21点扑克牌游戏。规则简介在这里智能体(Agent)扮演玩家(Player)，对方是庄家(Dealer)。点数(Score)：2-10的点数为牌面数字；J，Q，K是10点；A有两种算法，1或者11，算11总点数不超过21时则必须算成11(usable)，否则算作1。庄家需要亮(Show)一张牌，玩家根据自己手中的牌和庄家亮的牌决定是要牌(hits)还是停牌(sticks)。庄家要牌和停牌的规则是固定的，即点数小于17必须要牌，否则停牌。爆牌(goes bust

2020-05-19 13:21:25 621

原创强化学习之基本核心概念与分类

1.基本词汇 States and Observations 状态S可以完整地描述外部环境，观察O有可能会遗漏。如果O能够完整地观察S，就是环境就是完全可观察，否则就是部分可观察的 Action Spaces 行动空间是所有可以的行动S组成的空间，可以是离散的，也可以是连续的。 Policies 策略可以是确定性的，一般表示为μ，也可以是随机的，一般表示为π。 Rewards 强化学习中Agent的目标是累积获得最多奖励，一般来说奖励是随着运动轨迹衰减的。从直观上

2020-05-18 21:27:16 1093

转载 TensorFlow WaveNet声音合成

WaveNet 是生成原始音频波形的深层生成模型。这项突破性的技术已经被 Google DeepMind引入（https://deepmind.com/blog/generate-mode-raw-audio/），用于教授如何与计算机对话。结果确实令人惊讶，在网上你可以找到合成声音的例子，电脑学习如何用名人的声音与人们谈话。所以，你可能想知道为什么学习合成音频是如此困难。听到的每个数字声音都是基于每秒 16000 个样本（有时是 48000 个或更多）建立一个预测模型，在这个模型中学习基于以前所有的样本.

2020-05-14 19:19:14 951

转载 k均值聚类算法原理和TensorFlow实现

1.原理简介k均值聚类是一种对数据进行聚类的技术，即将数据分割成指定数量的几个类，揭示数据的内在性质及规律。k 均值聚类是一种无监督学习方法。聚类技术很多，例如层次法、贝叶斯法和划分法。k 均值聚类属于划分聚类方法，将数据分成 k 个簇，每个簇有一个中心，称为质心，k 值需要给定。k 均值聚类算法的工作原理如下：随机选择 k 个数据点作为初始质心（聚类中心）。将每个数据点划分给距离最近的质心，衡量两个样本数据点的距离有多种不同的方法，最常用的是欧氏距离。重新计算每个簇的质心作为新的聚类中心，

2020-05-14 18:43:26 2816

转载强化学习之DQN（附莫烦代码）

1.简介想象用Q-learning 电子游戏的每一帧来学习电子游戏，每个图片就可以是一种状态，游戏中的角色又可以有多种动作(上下左右，下蹲跳跃等等)。如果用Q表来记录每一个动作所对应的状态，那么这张Q表将大到无法想象。DQN不用Q表记录Q值，而是用神经网络来预测Q值，并通过不断更新神经网络从而学习到最优的行动路径。深度 Q 网络（DQN）是将 Q learning 和卷积神经网络（CNN）结合在一起Off-policy是Q-Learning的特点，DQN中也延用了这一特点。而不同的是，Q-Lea

2020-05-14 18:04:44 3776 1

原创强化学习之Open AI Gym

在

2020-05-14 16:35:57 768

原创主成分分析法（PCA）原理和步骤

主成分分析（Principal Component Analysis，PCA）是一种多变量统计方法，它是最常用的降维方法之一，通过正交变换将一组可能存在相关性的变量数据转换为一组线性不相关的变量，转换后的变量被称为主成分。可以使用两种方法进行 PCA，分别是特征分解或奇异值分解（SVD）。假定有 p×n 维数据样本 X，共有 p 个样本，每行是 n 维，p×n 实矩阵可以分解为：这里，正交阵 U 的维数是 p×n，正交阵 V 的维数是 n×n（正交阵满足：UUT=VTV=1），Σ 是 n×.

2020-05-14 16:22:19 1535

转载 RNN循环神经网络原理与示例

循环神经网络（Recurrent Neural Network，RNN）很多实时情况都能通过时间序列模型来描述。

2020-05-14 14:03:07 1547

原创强化学习之Q_learing和sarsa

一.原理展示对比算法可知，Q_Learning在到达状态s`后，首先查询Q表，得到使该状态s`条件下Q值最大的动作a`，根据Q(s`, a`)计算Q现实，随后，通过Q现实和Q估计更新Q表在下一步执行过程中，该动作a`未必被选择Sarsa在到达状态s`后，根据贪心策略，选择动作a`,根据Q(s`, a`)计算Q现实，随后，通过Q现实和Q估计更新Q表在下一步执行过程中，该动作a`需要被执行二.Q learing代码三.Sarsa代码import numpy as ..

2020-05-14 12:21:43 343

翻译强化学习之MAB

强化学习不仅提供了指导人工智能agent如何行动的能力，还允许它通过和环境的相互作用自主学习。同时结合神经网络强大的表达能力和目标驱动学习方式，深度强化学习成为了强大的人工智能基本方法。构建这些人工智能程序和构建可监督学习程序有所不同。可监督学习只是简单的学习模型对某个输入的反馈，而强化学习算法使agent能够通过观察(observation)、奖励(reward)和动作(action)来学习对于输入的正确的反馈。双臂老虎机问题(Two-Armed bandit)最简单的强化学习问题就是多臂老虎机问

2020-05-13 17:35:10 1220

转载 CNN卷积神经网络原理及示例

一.原理CNN 由许多神经网络层组成。卷积和池化这两种不同类型的层通常是交替的。网络中每个滤波器的深度从左到右增加。最后通常由一个或多个全连接的层组成：Convnets 背后有三个关键动机：局部感受野、共享权重和池化。局部感受野如果想保留图像中的空间信息，那么用像素矩阵表示每个图像是很方便的。然后，编码局部结构的简单方法是将相邻输入神经元的子矩阵连接成属于下一层的单隐藏层神经元。这个单隐藏层神经元代表一个局部感受野。当然，可以通过重叠的子矩阵来编码更多的信息。例如，假设每个子矩阵的大小是

2020-05-13 16:12:22 1990

原创 tensorflow与感知机

TensorFlow 支持自动求导，可以使用 TensorFlow 优化器来计算和使用梯度。它使用梯度自动更新用变量定义的张量。本文将使用 TensorFlow 优化器来训练网络。

2020-05-13 13:04:16 206

原创 TensorFlow入门讲解

TensorFlow 是由 Google Brain 团队为深度神经网络（DNN）开发的功能强大的开源软件库，其允许将深度神经网络的计算部署到任意数量的 CPU 或 GPU 的服务器、PC 或移动设备上，且只利用一个 TensorFlow API。包括 TensorFlow 在内的大多数深度学习库能够自动求导、开源、支持多种 CPU/GPU、拥有预训练模型，并支持常用的NN架构，如递归神经网络（RNN）、卷积神经网络（CNN）和深度置信网络（DBN）。TensorFlow 则还有更多的特点，如下：支持所

2020-05-12 20:23:46 890

RosebudTT的博客