自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hustqb的博客

机器学习、深度学习、Python等方面的学习笔记

翻译 Attention入门及其在Tensorflow中实现

翻译自Tensorflow官方教程Neural machine translation with attention 声明: 本文将实现一个将西班牙语翻译成英语的seq2seq模型; 需要读者对seq2seq模型有了解; 需要读者对nlp中一些数据处理方式有了解; 翻译并非直译,会比原文更直白和...

2020-02-16 18:38:49 170 1

原创 了解一下Sklearn中的文本特征提取

文本特征提取 基于词袋的向量化 要知道,原始文本是不能直接被机器学习到的,因为机器通常需要以数值型的、定长的数据作为输入。 原始文本是字符串或字符串集合。 数值型、定长的数据是浮点型或整型的向量。 为了让原始为本转化成数值型地、定长的向量,sklearn提供了三种常用的工具: 令牌化字符串 ...

2019-11-16 17:39:29 130 0

翻译 不同版本Inception Network介绍

声明 参考A simple Guide to the Versions of the Inception Network,同时有一定的原创性。 现在网上有很多有关Inception的文章,但是都不如这篇英文文章介绍得好。 本文希望读者提前对神经网络、CNN有所了解。 Inception网络是卷...

2018-12-28 16:04:34 1301 1

原创 给模型热身——深度学习中的warm up

Warm up是BERT 中一项重要的trick,它是什么,它究竟能带给我们什么,以及如何实现。 它是什么 Warm up是一种学习率的设置方法,其学习率的变化如下图所示。 假设我们使用随训练衰减的学习率设置方法,学习率的最大值是ppp。 在模型训练的前nnn步进行warm up,第iii步的学...

2020-04-24 22:52:27 181 0

原创 Tensorflow中的masking和padding

声明: 需要读者对tensorflow和深度学习有一定了解 tf.boolean_mask实现类似numpy数组的mask操作 Python的numpy array可以使用boolean类型的数组作为索引,获得numpy array中对应boolean值为True的项。示例如下: # nump...

2020-02-23 18:35:26 225 0

原创 【论文阅读】对CNN进行序列分类的理解或者说是使用指南

论文:A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classification 2016年的论文,中国人的论文,作者写得很认真,每次实验的都非常...

2020-02-09 11:10:12 267 0

原创 reuse tf.keras.layers

本文介绍如何重用tf.keras.layers中的层。 在tensorflow中,我们可以通过variable_scope和reuse参数控制变量的初始化和重用。但当我们在tensorflow中使用tf.keras.layers时,这种参数重用的方式就失效了。 不幸的是,tensorflow文档不...

2020-01-28 10:25:49 204 0

原创 自然语言处理中的Word Embedding简介

本文参考自What Are Word Embeddings for Text 简介 Word Embedding可以将word转化为数值型词向量,便于后续机器学习和深度学习模型的训练。并且,word之间的相似性越大,词向量之间的距离越小。 Word Embedding有两大优势: 原本离散的wo...

2019-11-02 20:09:25 229 0

翻译 IDEA版本控制——同步本地和远程仓库

同步远程仓库到本地 当我们在本地对代码做了改动并准备上传到远程仓库前,需要先同步远程仓库,check一下远程仓库有没有改变。有三种方法: fetch changes pull changes update your project Fetch changes 等同于git fetch,从远程...

2019-10-27 15:27:29 363 0

原创 SQL创建表

SQL创建表的代码很简单,就是CREATE TABLE语句,但是在敲键盘之前,我们应该花更多的时间和经历来设计表的结构,想想一下几个方面: 表里会包含什么数据(即字段的名称),它们都是什么类型的数据(即字段的数据类型)? 表的名称是什么?通常需要有一个命名规范,一方面便于其他人能顾名思义,容易想...

2019-10-26 23:16:44 175 0

原创 NLP之词袋模型二

在NLP之词袋模型一中介绍了最基本利用词袋模型(Bag of Words)进行词向量表达对方法,本文介绍几种提升词袋模型性能的方法。 提升词袋模型性能的方法主要在以下几个方面: 词袋的管理 词向量表达方法的选择 词袋的管理 管理词袋包括:词袋的创建、词袋的维护。 为了更好的管理词袋,我们首先考...

2019-08-18 21:58:25 608 0

原创 NLP之词袋模型一

声明:参考A Gentle Introduction to the Bag-of-Words Model 词袋模型 目的:将不定长的文本型数据转化为定长的数值型数据,以便用作机器学习模型的输入。 用处:常用于文本建模和分类。 优点:简单,易实现。 缺点:不能考虑文本的结构和顺序。 基本流程 1. ...

2019-08-16 21:41:26 171 0

原创 Python中的时间显示(time模块相关)

  Python提供了time模块来帮助我们处理时间,但是刚刚接触这个模块时,会发现time模块中的时间类型有很多,也有各种转换函数,难以让人把握住重点。下面本文将介绍time模块中最常用的部分,有了它,在处理大多是python时间问题上都不用愁了。 Python中的时间格式 Python中有三种...

2019-08-03 12:37:24 61 0

翻译 数据建模(Data Modeling)是什么?

声明:译自博客《What is Data Modelling? Conceptual, Logical, & Physical Data Models》 什么是数据建模? 数据建模(Data modeling)是为要存储在数据库中的数据创建数据模型的过程。数据建模在概念上包括以下3个部分:...

2019-05-23 21:33:05 8244 0

原创 马氏距离(Mahalanobis Distance)介绍与实例

temp

2019-05-20 09:27:26 8252 0

原创 超全面的协方差矩阵介绍

阅读本文需要具备一定的线性代数基础,通过本文,你将对协方差矩阵有全面的理解。 ## 定义 **n个随机向量:** $$\mathbf{X}=(X_1,X_2,...,X_n)^T$$ 两个随机向量的协方差: cov[Xi,Xj]=E[(Xi−E[Xi])(Xj−E[Xj])]cov[X_i,X...

2019-05-16 15:20:45 12190 4

翻译 4个帮你编写完美Python脚本的技巧

声明: 译自How to Write Perfect Python Command-line Interfaces --Learn by Examples 本文会基于例程介绍4个完善Python脚本的技巧 四个技巧 命令行参数解析中设置默认值 异常处理 帮助/说明文档 进度条控件 从一个例...

2019-03-06 10:56:55 608 0

原创 从二项分布推导泊松分布

参考:可汗学院 从二项分布推导泊松分布   二项分布:P(X=k)=Cnk⋅pk⋅(1−p)n−kP(X=k) = C_n^k\cdot p^k\cdot (1-p)^{n-k}P(X=k)=Cnk​⋅pk⋅(1−p)n−k 抛硬币   以抛硬币为例,ppp可以表示抛一次硬币,朝上的概率,P(X=...

2018-12-22 19:56:39 4229 7

翻译 Alexnet论文介绍(ImageNet Classification with Deep Convolutional Neural Networks)

摘要   本文训练了一个深度卷积神经网络进行ImageNet LSVRC-2010图片分类比赛(1000各类别,共120万高质量标注的图片),在top1测试场景下错误率37.5%,在top-5测试场景下错误率17.0%,远小于之前最好的结果。   网络的大体结构:6000万个参数、65万个神经节点...

2018-12-14 11:45:33 715 0

原创 HeadFirst设计模式——如何实现自己的鸭鸣器不继承Duck类?

声明: 《Head First设计模式》23页提问,如何实现自己的鸭鸣器不继承Duck类?本文解答这个问题。 正如该书前面所说,通常【有一个】比【是一个】更好。MallardDuck, RedheadDuck, ModelDuck都是鸭子,所以它们继承了父类Duck,也就继承了父类的属性fl...

2018-12-08 20:03:29 434 1

翻译 5分钟了解受限玻尔兹曼机(RBM)

声明:译自A Beginner’s Guide to Restricted Boltzmann Machines (RBMs) Definition & Structure 玻尔兹曼机(RBM)由深度学习先驱Geoffrey Hinton提出,可用于降维、分类、回归、协同过滤、特征...

2018-12-06 10:38:47 2004 2

翻译 Sampling Matters in Deep Embdding Learning论文研究

声明: 论文链接Sampling Matters in Deep Embdding Learning Sampling Matters in Deep Embdding Learning   这是基于one-shot learning中的metric learning范畴做的研究。metric...

2018-11-13 22:01:20 340 0

翻译 Matching Networks for One Shot Learning论文分析

Matching Networks for One Shot Learning Abstract 研究领域: One Shot Learning(小样本学习)从少量样本中快速学习,是传统监督学习和Deep Learning无法解决的问题,该研究领域被称为小样本学习。 创新: 以下两种方法结合: ...

2018-11-08 14:49:18 6159 6

翻译 tf.control_dependencies()

声明: 翻译tensorflow官方文档并进行了总结 参考博客tensorflow学习笔记(四十一):control dependencies tf.control_dependecies() tf.control_dependencies是tensorflow中的一个flow顺序控制机制,作...

2018-10-30 17:15:32 4361 0

转载 最大似然估计、贝叶斯估计和最大后验估计

声明: 转载自参数估计:最大似然、贝叶斯与最大后验 前言 中国有句话叫“马后炮”,大体上用在中国象棋和讽刺人两个地方,第一个很厉害,使对方将帅不得动弹,但这个跟我们今天说的基本没关系;第二个用途源于第一个,说事情都发生了再采取措施,太迟了。但不可否认,我们的认知就是从错误中不断进步,虽然...

2018-08-25 11:51:52 312 0

原创 TensorFlow SavedModel保存和加载模型

声明: 参考TensorFlow官方文档 SavedModel 如果你想保存或恢复模型,我们推荐使用SaveModel. SaveModel是一种与语言无关,可恢复的密封式序列化格式。TensorFlow提供了多种与SavedModel交互的机制,如tf.saved_model API、...

2018-06-23 11:30:03 12988 0

原创 TensorFlow保存和恢复变量——tf.train.Saver()

声明: 参考Tensorflow官方文档 tf.train.Saver() 保存变量 import tensorflow as tf # Create some variables. v1 = tf.get_variable("v1_name&am...

2018-06-22 17:11:49 3995 0

翻译 7天微课程——用Python进行时间序列预测

声明: 本文是系列课程的开始 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享者 课程列表 时间序列与监督学习 下载时间序列数据集 数据可视化 persistence模型 自回归模型 ARIMA模型 “Hello World”项目 每个课程将占用1-30min,加油干吧...

2018-06-20 09:22:45 534 0

翻译 7天微课程day7——完整项目:用Python预测法国香槟的月销量

声明: 终于到最后一天了,开不开心,激不激动?来瓶香槟奖励一下自己。 然后今天的任务很艰巨….毕竟最后一天了,笔者也有点小激动,可能行文风格有点飘,哈哈不要见怪。 另外,再安利一波,加入这个机器学习社区跟着大神Jason一起学习吧。 用Python预测法国香槟的月销量 要做好时间序列...

2018-06-19 22:16:42 2519 0

原创 Python lag_plot()源码

能找到本文说明您也是想用lag_plot()函数却找不到它的参数说明文档,花2分钟阅读本文,然后problem solved! lag_plot lag_plot()用于时间序列的自相关性分析,可以描绘pandas对象series中当前值和滞后值之间的散点图。其源码在~/pandas/plot...

2018-06-19 11:59:11 976 0

翻译 7天微课程day6——用ARIMA模型进行时间序列预测

声明: 本文是系列课程的第6课 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享 用ARIMA模型进行时间序列预测 ARIMA(AutoRegressive Intergrated Moving Average)是一个非常非常流行的时间序列预测模型。 通过本文,你将了解: ...

2018-06-18 22:41:09 4617 3

翻译 7天微课程day5——用于时间序列的自相关模型AM

声明: 本文是系列课程的第5课 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享 用于时间序列的自相关模型AM AM简单高效,它以t-1时刻的值为输入,经过回归方程获取预测值。 在本文中,你讲学到: 如何研究时间序列的自相关性 如何定义一个自相关模型 如何使用自相关模型...

2018-06-18 11:36:42 1283 3

翻译 7天微课程day4——时间序列预测的baseline

声明: 本文是系列课程的第4课 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享 时间序列预测的baseline 创建一个baseline总是时间序列预测的关键一步。一个baseline可以帮助我们了解模型的好坏。本文将会创建一个基本的时间序列预测模型——persistence模...

2018-06-18 10:19:11 1737 0

翻译 7天微课程day3——用Python进行时间序列可视化

声明: 本文是系列课程的第三课 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享 用Python进行时间序列可视化 Python中有6中可视化时间序列的方法 时间序列本身的特性决定了它很容易被可视化,特别适用于折线图。然而,还有一些其他方法可以可视化时间序列,而且会展现时间...

2018-06-17 11:15:57 2690 0

翻译 7天微课程day2——下载序列数据集

声明: 本文是系列课程的第二课 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享 下载序列数据集 要使用的Python第三方库:Pandas 通过本文,你可以学到: 如何使用pandas读取一个csv文件。 如何查看加载的数据,如何计算数据的统计量。 如何可视化时间序列 ...

2018-06-16 14:53:13 598 0

翻译 7天微课程day1——时间序列与监督学习

声明: 本文是系列课程的第一课 本文是对机器学习网站课程的翻译 尊重原作者,尊重知识分享者 时间序列预测与监督学习 时间序列预测可以被构建成监督学习问题,进而可以应用各种常见的机器学习算法。 通过本文你将学会: 什么是监督学习?机器学习中的预测算法是如何工作的。 滑动窗口方法及其在...

2018-06-14 21:48:33 1031 0

原创 全面解读循环神经网络

声明: 适用于对深度学习有一定了解,并想进一步了解RNN以及LSTM的朋友。 本文包括原理和应用,特别长,可以先收藏再慢慢看。 框架:TensorFlow RNN的发展、意义什么的都不讲了,全是硬知识。 参考文献: Understanding LSTM Networks TensorFlow...

2018-06-13 10:55:49 765 0

翻译 t-SNE实践——sklearn教程

声明: 参考sklearn官方文档 t-SNE t-SNE是一种集降维与可视化于一体的技术,它是基于SNE可视化的改进,解决了SNE在可视化后样本分布拥挤、边界不明显的特点,是目前最好的降维可视化手段。 关于t-SNE的历史和原理详见从SNE到t-SNE再到LargeVis。 代...

2018-06-09 21:14:36 27984 6

翻译 Python-Matplotlib绘图教程之Annotations

声明: 翻译自官方文档 并非直译 在一些官方代码中去掉了不重要的部分 Annotations Annotation,意为“注释”。本文将依照matplotlib官方文档,摘取Annotation章节中的常用部分,结合实例予以介绍。 Annotation基础 matplotlib中的t...

2018-05-29 21:22:21 783 0

翻译 tensorflow教程——tf.GraphKeys

GraphKeys tf.GraphKeys包含所有graph collection中的标准集合名,有点像Python里的build-in fuction。 首先要了解graph collection是什么。 graph collection 在官方教程——图和会话中,介绍什么是tf.Gr...

2018-05-21 22:16:02 11818 0

提示
确定要删除当前文章?
取消 删除