自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

皮皮blog

Talk is cheap, Show me the code!

  • 博客(683)
  • 资源 (104)
  • 收藏
  • 关注

原创 PyTorch:tensor-基本操作

相同点:tensor.data和tensor.detach() 都是变量从图中分离,都是“原位操作 inplace operation”,都是变成require s_grad = False。不同点:(1).data 是一个属性,.detach()是一个方法;(2).data 是不安全的,.detach()是安全的。

2020-10-28 22:09:34 6013 2

原创 todotodo

jjj

2020-10-28 21:13:45 166

原创 PyTorch:tensor-数学API

-柚子皮-乘法API1. 二维tensor相乘:torch.mma是 [m, k],b是[k, n],结果是 [m, n]c = torch.mm(a, b)2. 三维tensor相乘torch.bmm只能用于三维tensor相乘,这个函数不支持广播,也就是第一维必须相同,另外两维符合矩阵相乘法则c = torch.bmm(a, b)3. 任意多维tensor相乘:torch.matmul支持广播;当两个都是一维时,表示点积c = torch.matmul(a, b)利用这

2020-10-22 23:04:54 2113 2

原创 PyTorch:tensor-张量维度操作(拼接、维度扩展、压缩、转置、重复……)

张量维度操作(拼接、维度扩展、压缩、转置、重复……)-柚子皮-torch.cat(seq, dim=0, out=None) 多个tensor拼接在指定的维度dim上对序列seq进行连接操作。参数:seq (sequence of Tensors) - Python序列或相同类型的张量序列dim (int, optional) - 沿着此维度连接张量out (Tensor, optional) - 输出参数例子:x = torch.randn(2, 3)x-0.5866 -0.

2020-10-22 23:04:20 56283 1

原创 深度学习:batch_size和学习率 及如何调整

-柚子皮-学习率衰减import torch.optim as optimfrom torch.optim import lr_scheduler# 训练前的初始化optimizer = optim.Adam(net.parameters(), lr=0.001)#学习率衰减scheduler = lr_scheduler.StepLR(optimizer, 10, 0.1) # # 每过10个epoch,学习率乘以0.1# 训练过程中for n in n_epoch: ...

2020-10-21 00:17:08 35030 2

原创 PyTorch:输出层和损失函数loss function

输出和目标的维度是(batch,C),batch是样本数量,C是类别数量,对于每一个batch的C个值,对每个值求sigmoid到0-1之间,所以每个batch的C个值之间是没有关系的,相互独立的,所以之和不一定为1。,输出和目标的维度是(batch,C),batch是样本数量,C是类别数量,每一个C之间是互斥的,相互关联的,对于每一个batch的C个值,一起求每个C的softmax,所以每个batch的所有C个值之和是1,哪个值大,代表其属于哪一类。Note: 这里加view[两个神经元算loss时。

2020-10-21 00:16:47 2537

原创 PyTorch:模型训练、评估和预测

模型训练、评估和预测。

2020-10-21 00:16:20 16097 1

原创 PyTorch:nn模型层container

命名方式 {自动识别名称如bn_layers}.0.weight。

2020-10-20 23:41:19 897 1

原创 PyTorch:模型训练-parameters和optimizer

迭代打印model.named_parameters()将会打印每一次迭代元素的名字和paramparam.requires_grad=False # 顺便改下属性。

2020-10-20 23:39:40 8806 2

原创 PyTorch:nn模型层+nn方法

embedding + rnn + cnn等

2020-10-20 23:38:23 1592 1

原创 GPT-1、GPT-2和GPT-3模型详解及其进化之路

原文[OpenAI gpt模型基于Transformer的语言模型,其利用Transformer的decoder结构来进行单向语言模型的训练。GPT的核心思想是先通过无标签的文本去训练生成语言模型,再根据具体的NLP任务(如文本蕴涵、QA、文本分类等),来通过有标签的数据对模型进行fine-tuning。文中所用的网络结构如下:​。

2020-09-22 23:27:17 3681 1

原创 todotodo

-柚子皮-from:-柚子皮-ref:

2020-09-22 23:24:19 5736

原创 PyTorch:数据读取2 - Dataloader

Dataloader的处理逻辑是先通过Dataset类里面的函数获取单个数据,然后组合成batch,再使用collate_fn所指定的函数对这个batch做一些操作(比如每个batch中实际lengths,padding,cuda之类的)。因为dataloader是有batch_size参数的,我们可以通过自定义来设计数据收集的方式,意思是已经通过上面的Dataset类中的函数采样了batch_size数据,以一个包的形式传递给collate_fn所指定的函数。示例1:通过collate_fn进行解包。

2020-09-11 10:10:51 6019 1

原创 PyTorch:数据读取1 - Datasets和TensorDataset

PyTorch提供了一个工具函数。通过这个类,我们可以让数据变成mini-batch,且在准备mini-batch的时候可以多线程并行处理,这样可以加快准备数据的速度。Datasets就是构建这个类的实例的参数之一。DataLoader的使用参考[PyTorch:数据读取2 - Dataloaderdataset必须继承自内部要实现两个函数:一个是__lent__用来获取整个数据集的大小,一个是用来从数据集中得到一个数据片段item。

2020-09-10 22:31:02 6253

原创 中文分词:正向最大匹配与逆向最大匹配

正向(前向)最大匹配与逆向(后向)最大匹配。所谓词典正向最大匹配就是将一段字符串进行分隔,其中分隔 的长度有限制,然后将分隔的子字符串与字典中的词进行匹配,如果匹配成功则进行下一轮匹配,直到所有字符串处理完毕,否则将子字符串从末尾去除一个字,再进行匹配,如此反复。示例说明示例1:对字符串:“研究生命的起源”进行分词。假定我们的字典中的相关内容如下:研究研究生...

2020-04-15 00:36:36 7868

原创 中文句法分析

中文语法http://中文语法音节...词词是由语素组成的最小的造句单位。从构成方式来看,可以分成:单纯词和合成词。从词性来看,可以分成:实词和虚词。

2020-04-15 00:26:09 10680 1

原创 深度学习:批归一化和层归一化Batch Normalization、Layer Normalization

深度神经网络模型训练难,其中一个重要的现象就是 Internal Covariate Shift. Batch Norm 自 2015 年由Google 提出之后, Layer Norm / Weight Norm / Cosine Norm 等也横空出世。Normalized的作用1.1 独立同分布与白化1.2 深度学习中的 Internal Covariate Sh...

2020-03-10 00:44:29 14623 4

原创 Tensorflow:variable变量和变量空间

name_scope: 为了更好地管理变量的命名空间而提出的。比如在 tensorboard 中,因为引入了 name_scope, 我们的 Graph 看起来才井然有序。 variable_scope: 大部分情况下,跟 tf.get_variable() 配合使用,实现变量共享的功能。with tf.variable_scope('scopename', reu...

2019-08-01 21:13:12 4533

原创 深度文本匹配模型:ESIM

ESIM,简称 “Enhanced LSTM for Natural Language Inference“,一种专为自然语言推断而生的加强版 LSTM。ESIM模型主要是用来做文本推理的,给定一个前提premise pp 推导出假设hypothesis hh,其损失函数的目标是判断pp与hh是否有关联,即是否可以由pp推导出hh,因此,该模型也可以做文本匹配,只是损失函数的目标是...

2019-07-14 22:01:26 293 1

原创 Tensorflow:模型保存和服务

tensorflow模型保存和使用TensorFlow是通过构造Graph的方式进行深度学习,任何操作(如卷积、池化等)都需要operator,保存和恢复操作也不例外。在tf.train.Saver()类初始化时,用于保存和恢复的save和restore operator会被加入Graph,所以类初始化操作应在搭建Graph时完成。TensorFlow会将变量保存在二进制checkpoint文...

2019-07-13 17:38:28 3076 1

原创 PyTorch:安装和配置

安装pip安装pip3 install torch torchvisionmacos还需要安装brew install libomp否则出错:ImportError: dlopen(/...torch/_C.cpython-36m-darwin.so, 9): Library not loaded: /usr/local/opt/libomp/lib/libomp.dylib...

2019-07-13 17:09:56 2194

原创 深度学习:bert embedding用法详解

环境配置下载bert已训练好的模型如BERT-Base, Chinese: Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameters解压到目录/.../chinese_L-12_H-768_A-12/,其中...为你自己的某个目录。[https://github.co...

2019-07-13 17:09:27 6516 1

原创 Keras:模型评估

keras模型评估keras能用的模型评估不多,有的可能是这些评估在keras框架下不准确,如果要用,可以使用tensorflow或者sklearn中的评估模型。tensorflow:from tensorflow.python.estimator import trainingresult = training.train_and_evaluate(dnn_estimat...

2019-07-13 17:08:37 2004 3

原创 Keras:框架架构

from:-柚子皮-ref:

2019-07-13 17:08:06 1117

原创 Tensorflow:常见错误

Tensorflow SSE报错TensorFlow wasn't compiled to use SSE (etc.) instructions, but these are available解决:os.environ['TF_CPP_MIN_LOG_LEVEL']='2'[TensorFlow wasn't compiled to use SSE (etc.) instru...

2019-07-13 17:06:54 1089

原创 Tensorflow:可视化学习TensorBoard

用 TensorBoard 来展现 TensorFlow 图,绘制图像生成的定量指标图以及显示附加数据(如其中传递的图像)。tensorflow.summaryscalar一般用于数值的显示如tf.summary.scalar(softmax_cross_entropy) tf.summary.scalar(loss)histogram一般用于向量的分布...

2019-07-13 17:06:31 2544

原创 Tensorflow:模型调参

Tensorflow中使用gridsearch1 使用tf.contrib.learn.estimators使用tf中自带的Estimator将自定义的tf模型转换成估计器,输入到sklearn中的gridesearch运行。# My custom model. # Feature request: New params dict with values filled ...

2019-07-13 17:06:14 855

原创 Tensorflow:模型训练tensorflow.train

深度学习训练中的几个概念(1)batchsize:批大小。在深度学习中,一般采用SGD训练,即每次训练在训练集中取batchsize个样本训练;一次Forword运算以及BP运算中所需要的训练样本数目,其实深度学习每一次参数的更新所需要损失函数并不是由一个{data:label}获得的,而是由一组数据加权得到的,这一组数据的数量就是[batch size]。当然batch size 越大...

2019-07-13 17:05:51 1863

原创 Tensorflow:seed用法详解

##### file1 #####import tensorflow as tf# tf.set_random_seed(1234)# a = tf.Variable(tf.random_uniform([2, 2], 0, 1), name="aaa")a = tf.Variable(tf.random_uniform([2, 2], 0, 1, seed=1234, name...

2019-07-13 17:05:17 2131

原创 Tensorflow:estimator训练

学习流程:Estimator 封装了对机器学习不同阶段的控制,用户无需不断的为新机器学习任务重复编写训练、评估、预测的代码。可以专注于对网络结构的控制。数据导入:Estimator 的数据导入也是由 input_fn 独立定义的。例如,用户可以非常方便的只通过改变 input_fn 的定义,来使用相同的网络结构学习不同的数据。网络结构:Estimator 的网络结构是在 model_fn 中独...

2019-07-13 17:04:17 6557

原创 Tensorflow:分类模型评估

使用tf.estimator时,如果调用 Estimator 的 evaluate 方法,则 model_fn 会收到 mode = ModeKeys.EVAL。在这种情况下,模型函数必须返回一个包含模型损失和一个或多个指标(可选)的 tf.estimator.EstimatorSpec。虽然返回指标是可选的,但大多数自定义 Estimator 至少会返回一个指标。TensorFl...

2019-07-13 17:03:57 4124

原创 TensorFlow:交叉熵损失函数

基础softmax归一化计算什么是logits? logits就是神经网络模型中的W * X矩阵,注意不需要经过sigmoid,即为未通过激活函数的原始输出。Tensorflow "with logit": The input_vector/logit is not normalized and can scale from [-inf, inf].[What...

2019-07-13 17:03:28 4888

原创 Tensorflow:特征处理

wide and deep 模型训练一般是以多个训练样本作为 1 个批次 (batch) 进行训练,训练样本在行维度上定义,每一行对应一个训练样本实例,包括特征(feature column),标注(label)以及权重(weight),如图 2。特征在列维度上定义,每个特征对应 1 个 feature column,feature column 由在列维度上的 1 个或者若干个张量 (tensor) 组成,tensor 中的每个元素对应一个样本在该 feature column 上某个维度的值。

2019-07-13 17:02:55 3827 1

原创 Tensorflow:dataset数据读取

Tensorflow输入Dataset读取使用dataset读取batch数据示例DEBUG = Truemlb = MultiLabelBinarizer()with open(os.path.join(DATADIR, 'vocab.tags.txt'), 'r', encoding='utf-8') as f: mlb.fit([[l.strip() for l ...

2019-07-13 17:01:01 3732

原创 Tensorflow:操作执行原理

基本原理在TensorFlow中,所有的操作只有当你执行,或者另一个操作依赖于它的输出时才会运行。运行op构建图时不需要显示声明变量名,如tf.concat(axis=1, values=initial_state, name="initial_state")直接使用图中的name就可以运行了。initial_state = sess.run(fetches="lstm...

2019-07-13 17:00:18 531

原创 Tensorflow:安装和配置

安装anacondawindows下直接安装,最好勾上python加入系统路径。查看及安装tensorflow依赖查看cuda版本(机器支持gpu的不考虑)cat /usr/local/cuda/version.txtcuda版本及其对应tf版本:[经过测试的构建配置]查看python版本python -V安装python环境anaconda参考[pytho...

2019-07-13 16:59:43 1945 1

原创 Tensorflow函数映射:py_func和map_fn

tf.map_fn[tf.map_fn]:map on the list of tensors unpacked from elems on dimension 0. 接受一个函数对象,然后用该函数对象对集合(elems)中的每一个元素分别处理,tf.map_fn( fn, elems, dtype=None, parallel_iterations=Non...

2019-07-04 21:38:02 4983 2

原创 Tensorflow:tensor数据类型转换、计算和变换

示例import tensorflow as tfx = tf.constant([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])y = tf.constant([[[11, 12, 13], ...

2019-06-05 14:43:17 7526 1

原创 todotodo

todotodo。

2019-04-24 16:01:42 3941

原创 深度学习:文本CNN-textcnn

对于文本分类问题,常见的方法无非就是抽取文本的特征,比如使用doc2evc或者LDA模型将文本转换成一个固定维度的特征向量,然后在基于抽取的特征训练一个分类器。然而研究证明,TextCnn在文本分类问题上有着更加卓越的表现。从直观上理解,TextCNN通过一维卷积来获取句子中n-gram的特征表示。TextCNN对文本浅层特征的抽取能力很强,在短文本领域如搜索、对话领域专注...

2018-12-18 20:30:48 62938 10

Parameter estimation for text analysis

Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich

2016-05-23

pdfstudio安装文件及破解

pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar

2016-03-24

spark机器学习示例代码

spark机器学习示例代码 machine learning with spark

2016-03-06

偏置方差分解推导

偏置方差分解 Bias-variance decompose

2016-02-05

Bias-variance decomposition推导

Bias-variance decomposition 偏置方差分解推导

2016-02-05

milk安装包

milk 安装包 win7 64位 python2

2016-01-02

python2 scipy安装包

scipy 安装包 win7 64位 python2.exe

2016-01-02

pywin32 py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

scikit learn py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

matplotlib安装包

matplotlib安装文件 win7 64位 python2 包含matplotlib.exe安装文件及其依赖包(pyparsing,dateutil等等) 先安装依赖包,再安装matplotlib.exe文件

2016-01-02

python pip安装包

python pip 安装包 win7 64位 python2

2016-01-02

numpy安装包

numpy 安装包 win7 64位 python2

2016-01-02

scipy安装包

scipy 安装包 win7 64位 python3

2016-01-02

scikit learn安装包

scikit-learn 安装包 win7 64位 python3

2016-01-01

PyQt5安装包

PyQt5 安装包 win7 64位 python3

2016-01-01

pandas安装文件

pandas-0.16.0-cp34-none-win_amd64.whl安装包 win7 64位 python3拓展安装包 提示: 安装whl文件方法 1>打开python,在python命令行中输入(如果提示install错误,见2>) pip install ****.whl 2>直接在cmd中输入上面的安装命令

2016-01-01

matplotlib安装文件

matplotlib安装文件 win7 64位 python3 包含matplotlib.exe安装文件及其依赖包(pyparsing,dateutil等等) 先安装依赖包,再安装matplotlib.exe文件

2016-01-01

SnapShot4.4.exe

QQ2015 截图工具 可以截取弹窗 可以保存 完全如同打开QQ后的截图一样

2015-09-03

get-pip.py

python pip安装程序

2015-08-12

GB2UTF8.exe

GB2UTF8.exe utf8 gbk big5三向转换,方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换,方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换,方便您将文本文件转换到需要的格式。

2015-08-07

主题挖掘测试数据

主题挖掘测试数据

2015-06-03

A First Course in Probability 第8版 Sheldon Ross

A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross

2014-10-31

GAME THEORY-Thomas

GAME THEORY-Thomas

2014-09-13

组合博弈入门.ppt

组合博弈入门.ppt

2014-09-13

noi2002测试数据

noi2002测试数据

2014-09-13

NOI2012测试数据

NOI2012测试数据

2014-09-13

NOI2011测试数据

NOI2011测试数据

2014-09-13

noi2010测试数据

noi2010测试数据

2014-09-13

noi2009测试数据

noi2009测试数据

2014-09-13

noi2008测试数据

noi2008测试数据

2014-09-13

noi2007测试数据

noi2007测试数据

2014-09-13

noi2006测试数据

noi2006测试数据

2014-09-13

wps symbol fonts

wps symbol font WPS for Linux 字体缺失的解决办法 启动WPS for Linux后,出现提示"系统缺失字体" 。 出现提示的原因是因为WPS for Linux没有自带windows的字体,只要在Linux系统中加载字体即可。 具体操作步骤如下: 1. 下载缺失的字体文件,然后复制到Linux系统中的/usr/share/fonts文件夹中。 下载完成后,解压并进入目录中,继续执行: sudo cp * /usr/share/fonts 2. 执行以下命令,生成字体的索引信息: sudo mkfontscale sudo mkfontdir 3. 运行fc-cache命令更新字体缓存。 sudo fc-cache 4. 重启wps即可,字体缺失的提示不再出现。

2017-02-27

Structured PCA

Structured Principal Component Analysis, Structured PCA

2016-08-02

PCAS示例代码

PCAS 示例代码 PlaneParts showpcs

2016-08-01

KcoreVertex

KcoreVertex c++代码 graphlite+hadoop实现

2016-06-10

avg-time hadoop程序

avg-time hadoop程序

2016-06-10

Anand.Rajaraman-Mining of Massive Datasets

Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版

2016-06-01

GIBBS SAMPLING FOR THE UNINITIATED

Philip Resnik-GIBBS SAMPLING FOR THE UNINITIATED

2016-05-30

概率图模型 原理与技术 科勒 清华大学 完整版

概率图模型 原理与技术 科勒 清华大学 完整版

2016-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除