自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 机器学习之LSTM

相比RNN只有一个传递状态 ,LSTM有两个传输状态,一个 cell state,和一个 hidden state。(Tips:RNN中的 h对于LSTM中的c )首先使用LSTM的当前输入 和上一个状态传递下来的 拼接训练得到四个状态。LSTM内部主要有三个阶段:1. 忘记阶段。这个阶段主要是对上一个节点传进来的输入进行选择性忘记。简单来说就是会 “忘记不重要的,记住重要的”。具体来说是通过计算得到的 (f表示forget)来作为忘记门控,来控制上一个状态的 哪些需要留...

2020-08-09 13:29:33 2045

原创 机器学习之隐士马尔科夫链简介

隐马尔可夫模型是关于时序的概率模型组成:初始概率分布,状态转移概率分布,观测概率分布Q:所有可能状态的集合,V:所有可能观测的集合,I: 长度为T的状态序列,O:对应的观测序列A:状态转移概率矩阵,B:观测概率矩阵,三要素1.概率计算问题2.学习问题3.近似问题...

2020-08-06 18:58:09 343

原创 机器学习之adaboost

AdaBoost的起源和基本概念adaptive boosting•在概率近似正确(probably approximately correct, PAC)学习的框架中,一个概念(类),如果存在一个多项式的学习算法能够学习它,并且正确率很高,称这个概念是强可学习的;•一个概念(类),如果存在一个多项式的学习算法能够学习它,学习的正确率仅比随机猜测略好,则称这个概念是弱可学习的。•在PAC学习的框架下,一个概念是强可学习的充分必要条件是这个概念是弱可学习。•只要找到一个比随机猜测略好的弱学

2020-07-24 19:32:53 263

原创 机器学习之决策树

5.21

2020-07-24 17:46:18 157

原创 机器学习之logistic回归与最大熵模型

5.22

2020-05-30 15:30:24 383

原创 通信中名词解释

RE(Resource Element)资源元素,或资源粒子。是LTE物理资源中最小的资源单位;在时域上占用1个OFDM Symbol(1/14 ms),频域上为1个子载波(15KHz)。平常所说的符号,即调制后的数据符号,是映射到RE上的,与OFDM 符号是两个不同的概念;RB(Resource Block),资源块。1RB=72RE。在频域上为1个timeslot(0.5ms,半个子帧时间长度,常规CP对应7个OFDM 符号),在频域上为12个子载波(180KHz)。通过RB的时频域不难看出,1RB

2020-05-25 12:21:01 1609

原创 机器学习之无监督学习简介

无监督学习的基本想法是对给定数据(矩阵数据)进行某种“压缩”,从而找到数 据的潜在结构。假定损失最小的压缩得到的结果就是最本质的结构。•考虑发掘数据的纵向结构,把相似的样本聚到同类,即对数据进行聚类•考虑发掘数据的横向结构,把高维空间的向量转换为低维空间的向量,即对数据进行降维。•同时考虑发掘数据的纵向与横向结构,假设数据由含有隐式结构的概率模型生成得到,从数据中学习该概率模型。概率模型表示为条件概率分布 无监督模型三要素:•模型•函数 ,条件概率分布,或条件概...

2020-05-23 17:48:47 282

原创 实用英语写作

英语写作的目的可以是为了某一个考试,但是当你认识到写作是一种思考方式,一种培养逻辑思维的方式时,写作才会真正的提高。从词汇的多样到短语的精悍到句子的复杂到段落之间的逻辑,不同的题材有不同的写作要求。但最重要的还是要多看多思考。一.层次结构英语句子写作1.学会扩展句子。并列句,从句,形容词等等。还是要以简单句意为基本想清楚再去做扩展。在追求高级句式的同时会用标点,不忘句意。2.注意不要让句子出错。高中学过的许多关于单复数的运用,关于句子结构完整性的体会,关于标点符号的使用要明晰。段落写作

2020-05-22 17:31:40 315

原创 python基础知识简版(学习笔记)

一.数据类型1.列表:app=['abc','zty']索引-1指向最后一个元素,-2倒数第二在列表末尾添加元素:append('…') 任何位置插入insert(2,'…') extend()对于列表的操作主要实现的是对于特定列表的扩展和增长,可以一次添加多个元素,不过也只能添加在列表的最后; m.extend([元素A,元素B,……]删除元素del mortor[1] mortor.pop(n)删除第n个元素,A= mortor.pop...

2020-05-22 17:08:37 214

转载 机器学习里的自编码器及应用

自动编码机(简称自编码器)是前馈非循环神经网络,是一种无监督机器学习方法,具有非常好的提取数据特征表示的能力,它是深层置信网络的重要组成部分,在图像重构、聚类、机器翻译等方面有着广泛的应用。自动编码机的一个非常好的应用是降维,也可用于特征提取、文档检索、分类和异常检测。自动编码机的目标是重构一样的输入,其神经元的状态是确定性的可以将自动编码机看作由两个级联网络组成,第一个网络是一个编码器,负责接收输入 x,并将输入通过函数 h 变换为信号 y,第二个网络将编码的信号 y 作为其输入,通过函数f得到重

2020-05-20 18:15:07 2243

原创 机器学习之SVM

2020-05-20 14:24:02 619

转载 强化学习之Actor-Critic

Actor-Critic方法合并了Value-based (比如 Q learning) 和 Policy-based (比如 Policy Gradients) 两类强化学习算法

2020-05-19 17:41:28 913

转载 强化学习之policy gradient

qo

2020-05-19 16:35:38 510

转载 强化学习之Monte Carol

这篇文章就用MC方法来玩21点扑克牌游戏。规则简介在这里智能体(Agent)扮演玩家(Player),对方是庄家(Dealer)。 点数(Score):2-10的点数为牌面数字;J,Q,K是10点;A有两种算法,1或者11,算11总点数不超过21时则必须算成11(usable),否则算作1。 庄家需要亮(Show)一张牌,玩家根据自己手中的牌和庄家亮的牌决定是要牌(hits)还是停牌(sticks)。 庄家要牌和停牌的规则是固定的,即点数小于17必须要牌,否则停牌。 爆牌(goes bust

2020-05-19 13:21:25 501

原创 强化学习之基本核心概念与分类

1.基本词汇 States and Observations 状态S可以完整地描述外部环境,观察O有可能会遗漏。如果O能够完整地观察S,就是环境就是完全可观察,否则就是部分可观察的 Action Spaces 行动空间是所有可以的行动S组成的空间,可以是离散的,也可以是连续的。 Policies 策略可以是确定性的,一般表示为μ,也可以是随机的,一般表示为π。 Rewards 强化学习中Agent的目标是累积获得最多奖励,一般来说奖励是随着运动轨迹衰减的。从直观上

2020-05-18 21:27:16 992

转载 TensorFlow WaveNet声音合成

WaveNet 是生成原始音频波形的深层生成模型。这项突破性的技术已经被 Google DeepMind引入(https://deepmind.com/blog/generate-mode-raw-audio/),用于教授如何与计算机对话。结果确实令人惊讶,在网上你可以找到合成声音的例子,电脑学习如何用名人的声音与人们谈话。所以,你可能想知道为什么学习合成音频是如此困难。听到的每个数字声音都是基于每秒 16000 个样本(有时是 48000 个或更多)建立一个预测模型,在这个模型中学习基于以前所有的样本.

2020-05-14 19:19:14 829

转载 k均值聚类算法原理和TensorFlow实现

1.原理简介k均值聚类是一种对数据进行聚类的技术,即将数据分割成指定数量的几个类,揭示数据的内在性质及规律。k 均值聚类是一种无监督学习方法。聚类技术很多,例如层次法、贝叶斯法和划分法。k 均值聚类属于划分聚类方法,将数据分成 k 个簇,每个簇有一个中心,称为质心,k 值需要给定。k 均值聚类算法的工作原理如下:随机选择 k 个数据点作为初始质心(聚类中心)。 将每个数据点划分给距离最近的质心,衡量两个样本数据点的距离有多种不同的方法,最常用的是欧氏距离。 重新计算每个簇的质心作为新的聚类中心,

2020-05-14 18:43:26 2615

转载 强化学习之DQN(附莫烦代码)

1.简介想象用Q-learning 电子游戏的每一帧来学习电子游戏,每个图片就可以是一种状态,游戏中的角色又可以有多种动作(上下左右,下蹲跳跃等等)。如果用Q表来记录每一个动作所对应的状态,那么这张Q表将大到无法想象。DQN不用Q表记录Q值,而是用神经网络来预测Q值,并通过不断更新神经网络从而学习到最优的行动路径。深度 Q 网络(DQN)是将 Q learning 和卷积神经网络(CNN)结合在一起Off-policy是Q-Learning的特点,DQN中也延用了这一特点。而不同的是,Q-Lea

2020-05-14 18:04:44 3610 1

原创 强化学习之Open AI Gym

2020-05-14 16:35:57 680

原创 主成分分析法(PCA)原理和步骤

主成分分析(Principal Component Analysis,PCA)是一种多变量统计方法,它是最常用的降维方法之一,通过正交变换将一组可能存在相关性的变量数据转换为一组线性不相关的变量,转换后的变量被称为主成分。可以使用两种方法进行 PCA,分别是特征分解或奇异值分解(SVD)。假定有 p×n 维数据样本 X,共有 p 个样本,每行是 n 维,p×n 实矩阵可以分解为:这里,正交阵 U 的维数是 p×n,正交阵 V 的维数是 n×n(正交阵满足:UUT=VTV=1),Σ 是 n×.

2020-05-14 16:22:19 1405

转载 RNN循环神经网络原理与示例

循环神经网络(Recurrent Neural Network,RNN)很多实时情况都能通过时间序列模型来描述。

2020-05-14 14:03:07 1425

原创 强化学习之Q_learing和sarsa

一.原理展示对比算法可知,Q_Learning在到达状态s`后,首先查询Q表,得到使该状态s`条件下Q值最大的动作a`,根据Q(s`, a`)计算Q现实,随后,通过Q现实和Q估计更新Q表在下一步执行过程中,该动作a`未必被选择Sarsa在到达状态s`后,根据贪心策略,选择动作a`,根据Q(s`, a`)计算Q现实,随后,通过Q现实和Q估计更新Q表在下一步执行过程中,该动作a`需要被执行二.Q learing代码三.Sarsa代码import numpy as ..

2020-05-14 12:21:43 280

翻译 强化学习之MAB

强化学习不仅提供了指导人工智能agent如何行动的能力,还允许它通过和环境的相互作用自主学习。同时结合神经网络强大的表达能力和目标驱动学习方式,深度强化学习成为了强大的人工智能基本方法。构建这些人工智能程序和构建可监督学习程序有所不同。可监督学习只是简单的学习模型对某个输入的反馈,而强化学习算法使agent能够通过观察(observation)、奖励(reward)和动作(action)来学习对于输入的正确的反馈。双臂老虎机问题(Two-Armed bandit)最简单的强化学习问题就是多臂老虎机问

2020-05-13 17:35:10 1086

转载 CNN卷积神经网络原理及示例

一.原理CNN 由许多神经网络层组成。卷积和池化这两种不同类型的层通常是交替的。网络中每个滤波器的深度从左到右增加。最后通常由一个或多个全连接的层组成:Convnets 背后有三个关键动机:局部感受野、共享权重和池化。局部感受野如果想保留图像中的空间信息,那么用像素矩阵表示每个图像是很方便的。然后,编码局部结构的简单方法是将相邻输入神经元的子矩阵连接成属于下一层的单隐藏层神经元。这个单隐藏层神经元代表一个局部感受野。当然,可以通过重叠的子矩阵来编码更多的信息。例如,假设每个子矩阵的大小是

2020-05-13 16:12:22 1874

原创 tensorflow与感知机

TensorFlow 支持自动求导,可以使用 TensorFlow 优化器来计算和使用梯度。它使用梯度自动更新用变量定义的张量。本文将使用 TensorFlow 优化器来训练网络。

2020-05-13 13:04:16 165

原创 TensorFlow入门讲解

TensorFlow 是由 Google Brain 团队为深度神经网络(DNN)开发的功能强大的开源软件库,其允许将深度神经网络的计算部署到任意数量的 CPU 或 GPU 的服务器、PC 或移动设备上,且只利用一个 TensorFlow API。包括 TensorFlow 在内的大多数深度学习库能够自动求导、开源、支持多种 CPU/GPU、拥有预训练模型,并支持常用的NN架构,如递归神经网络(RNN)、卷积神经网络(CNN)和深度置信网络(DBN)。TensorFlow 则还有更多的特点,如下:支持所

2020-05-12 20:23:46 744

原创 tensorflow实现回归算法

在回归中定义了损失函数或目标函数,其目的是找到使损失最小化的系数。声明一个损失函数需要将系数定义为变量,将数据集定义为占位标准线性回归符。可以有一个常学习率或变化的学习率和正则化常数。1.标准线性回归import tensorflow as tfm=100 //样本数量n=15 //特征数量p=2 //类别数量X=tf.placeholder(tf.float32,name='X')Y=tf.placeholder(tf.float32,name='Y')w0=tf.Variabl

2020-05-12 18:11:05 491

原创 python之scipy库详解

Scipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。它用于有效计算Numpy矩阵,使Numpy和Scipy协同工作,高效解决问题。...

2020-05-11 16:43:40 45166 6

原创 python之pandas库详解

pandas 相当于 python 中 excel:它使用表(也就是 dataframe),能在数据上做各种变换,但还有其他很多功能。pandas 最有趣的地方在于里面隐藏了很多包。它是一个核心包,里面有很多其他包的功能。这点很棒,因为你只需要使用 pandas 就可以完成工作...

2020-05-10 15:31:43 5294

原创 python之numpy库详解

使用前一定要先导入 Numpy 包 import numpy as np1.基本操作产生数组:从列表产生或直接将列表传入a=[1,2,3,4]a=np.array(a)a=np.array([1,2,3,4])查看列表属性:type(a)numpy.ndarray查看数组维度:np.array(a)1查看数组中的数据类型:a.dtypein...

2020-05-09 00:57:42 1462

原创 pyhthon之matplotlib库详解

用linespace生成一组等间隔数据import matplotlib.pyplot as pltimport numpy as npx = np.linspace(0.05, 10, 1000)y = np.cos(x)plt.plot(x, y, ls="-", lw=2, label="plot figure")plt.legend()plt.show()...

2020-05-07 17:46:17 646

原创 python之random库详解

1.基础random库伪随机数:计算机中通过采用梅森旋转算法生成的(伪)随机序列元素,Python中产生随机数使用随机数种子来产生 (只要种子相同,产生的随机序列,无论是每一个数,还是数与数之间的关系都是确定的,所以随机数种子确定了随机序列的产生)因为是标准库,使用时候只需要import randomrandom库包含两类函数,常用的共8个 --基本随机函数...

2020-05-07 14:04:41 849

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除