深度学习
文章平均质量分 66
MeteorMan99
一万年太久,只争朝夕
与君共勉之!
展开
-
windows平台Pytorch安装与使用
Pytorch自0.4.0版本提供了windows系统平台的支持。安装简称参考https://zhuanlan.zhihu.com/p/26871672自官网介绍的命令进行安装,速度缓慢,可按照如下两种方式进行安装(已在之前安装tensorflow时配置好了cuda和cudnn):方法一:pip安装Python3.6+pip安装cpu版本pip install http://...原创 2018-10-03 13:01:15 · 1701 阅读 · 0 评论 -
如何查找NLP相关论文
如何检索自然语言处理领域相关论文前言针对自身的情况,发现个人查找论文的能力,看论文的能力有些薄弱。特此进行如果检索合适的论文写一个博客。 本文主要是摘自刘知远 老师的新浪博客和南京理工大学文本挖掘研究组博客综述要快速地熟悉一个领域,更加深刻地了解这该领域的发展,就必须查阅这个领域的相关论文。本文主要讲述自然语言处理领域(NLP)相关论文的检索。与其他领域一样,自然语言处理领域...转载 2018-10-15 18:36:59 · 4686 阅读 · 1 评论 -
基于Seq2Seq的问答系统/聊天机器人
前几篇博客介绍了基于检索聊天机器人的实现、seq2seq的模型和代码,本篇博客将从头实现一个基于seq2seq的聊天机器人。这样,在强化学习和记忆模型出现之前的对话系统中的模型就差不多介绍完了。后续将着重介绍强化学习和记忆模型在对话系统中的应用。基于检索的聊天机器人的实现seq2seq模型详解tensorflow中的seq2seq的代码详解闲聊机器人在网上有很多有趣的小例子:c...原创 2018-12-03 14:03:41 · 6952 阅读 · 12 评论 -
Tensorflow:基于LSTM生成藏头诗
模型生成首先我们要训练好模型。这里采用的是2层的LSTM框架,每层有128个隐藏层节点,batch_size设为64。训练数据来源于全唐诗。特别注意到的一点是这里每训练完一次就对训练数据做shuffle。 源代码如下:#!/usr/bin/python3#-*- coding: UTF-8 -*-import collections import numpy as np im...原创 2018-12-06 16:23:29 · 1019 阅读 · 1 评论 -
中英文词向量资源合集
主要针对当前NLP领域表现较好的词向量模型进行一下整理,分为中文和英文领域。1.中文针对中文领域,不需要再去找什么资源,github上提供了中文NLP的一个利器,去里面下载即可。下载链接:https://github.com/Embedding/Chinese-Word-Vectors除此之外,由腾讯的AILab发布的词向量模型表现也很不错:https://ai.tencent...原创 2019-03-01 10:33:40 · 5855 阅读 · 1 评论 -
Win10下启动tensorflow程序加载显卡时间长
我是基于win10+tf1.12.0+cuda10配置的环境,但在第一次执行hello程序时加载资源很慢,去找了下资料,把步骤记载下来:(tf-gpu) C:\Users\don> conda install -c anaconda cudatoolkit(tf-gpu) C:\Users\don> conda install -c anaconda cudnn在anaco...原创 2019-03-07 15:43:50 · 2504 阅读 · 3 评论 -
Keras中设置GPU使用
指定GPU并设置为按需增长:"""GPU设置为按需增长"""import osimport tensorflow as tfimport keras.backend.tensorflow_backend as KTF# 指定第一块GPU可用os.environ["CUDA_VISIBLE_DEVICES"] = "0"config = tf.ConfigProto()confi...原创 2019-03-26 10:22:07 · 14351 阅读 · 1 评论 -
Windows安装Pytorch
这里只提示一点,pip可以安装Python2的Pytorch1.0的cpu版本,如果要安装gpu版本,请升级到Python3:方式1:使用pip获取whl文件安装Python2.7 cpu版本:pip install https://download.pytorch.org/whl/cpu/torch-1.0.0-cp27-cp27mu-linux_x86_64.whl pip i...原创 2019-06-11 09:16:07 · 1829 阅读 · 0 评论 -
论文中注意力机制可视化图的制作
推荐使用seaborn提供的热力图来制作。以下是个人经验:最近在使用注意力机制实现文本分类,我们需要观察每一个样本中,模型的重心放在哪里了,就是观察到权重最大的token。这时我们需要使用热力图进行可视化。我这里用到:seabornseaborn.heatmapseaborn.heatmap(data, vmin=None, vmax=None, cmap=None, cent...原创 2019-07-25 11:52:36 · 21068 阅读 · 3 评论 -
使用flask和keras部署深度学习模型bug解决之ValueError: Tensor Tensor("dense/Softmax:0", shape=(?, 3), dtype=float32)
在利用keras+flask构建一个简单的深度学习后台服务器,遇到了如下的问题:ValueError: Tensor Tensor("fc1000/Softmax:0", shape=(?, 1000), dtype=float32) is not an element of this graph。解决方案如下:在初始化的时候,加载模型文件和生成graph。示例代码如下:de...原创 2019-09-24 12:42:12 · 2655 阅读 · 0 评论 -
神经机器阅读理解-入门介绍篇
机器阅读理解(MachineReading Comprehension, MRC)任务主要是指让机器根据给定的文本回答与文本相关的问题,以此来衡量机器对自然语言的理解能力。这一任务的缘起可以追溯到 20 世纪 70 年代,但是受限于小规模数据集和基于规则的传统方法,机器阅读理解系统在当时并不能满足实际应用的需求。 这种局面在 2015 年发生了转变,主要归功于以下...原创 2019-09-25 16:53:03 · 337 阅读 · 0 评论 -
tensorflow GPU设置
tensorflow ConfigPrototf.ConfigProto一般用在创建session的时候。用来对session进行参数配置with tf.Session(config = tf.ConfigProto(...),...)#tf.ConfigProto()的参数log_device_placement=True : 是否打印设备分配日志allow_soft_pla...原创 2018-10-01 13:55:48 · 277 阅读 · 0 评论 -
论文Multi-Perspective Sentence Similarity Modeling with Convolution Neural Networks实现之网络模型搭建及训练
环境:Python3.6Tensorflow-GPU 1.8.0本文所实现的网络模型是在https://blog.csdn.net/liuchonge/article/details/64440110的基础上搭建的,不同的是为了应对loss为NAN的情况,本文在每一层卷积的后面都添加了一层BN,且comU1只计算cosine距离和L1距离,comU2只计算cosine距离。基于此,...原创 2018-09-07 16:03:24 · 335 阅读 · 2 评论 -
github上传文件涉及到的操作
一、解除GitHub上传文件大小限制上传项目到GitHub上,当某个文件大小超过100M时,就会上传失败,因为默认的限制了上传文件大小不能超过100M。如果需要上传超过100M的文件,就需要我们自己去修改配置。输入命令:git config http.postBuffer 524288000执行完以上语句后输入git config -l可以看到配置项的最下面多出了一行我们刚刚配置的内容...原创 2018-09-17 13:22:18 · 382 阅读 · 0 评论 -
MSCOCO数据集资源
登录ms-co-co数据集官网,一直不能进入,翻墙之后开看到下载链接。有了下载链接下载还是很快的,在我这儿晚上下载,速度能达到7M/s,所以也不上传到网盘了,有需要的人等夜深人静的时候下载效果更佳哦。我把2017的数据集下载链接贴上来,linux下wget非常快,不知道为什么迅雷不能下载,顺便说一下wget断点续传 wget -c httpcoco数据集下载链接各个链接的意思看链接里面的描述基本上...原创 2018-06-14 13:42:20 · 1378 阅读 · 0 评论 -
Win10下用Anaconda安装TensorFlow-CPU
https://blog.csdn.net/u010858605/article/details/64128466/转载 2018-06-17 23:56:01 · 183 阅读 · 0 评论 -
Tensorflow之基础函数解析1
1.tf.argmaxtf.argmax就是返回最大的那个数值所在的下标,axis=0:按列比较;axis=1:按行比较 2. tf.equal tf.equal(A, B)是对比这两个矩阵或者向量的相等的元素,如果是相等的那就返回True,反之返回False,返回的值的矩阵维度和A是一样的;3.tf.casttf.cast(x, dtype, name=None) 将x的数据格式...原创 2018-06-18 17:11:06 · 286 阅读 · 0 评论 -
win10下基于anaconda安装GPU版本的tensorflow1.8.0 cuda9.0 cudnn9.0
cudnn9安装包:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_win10-exe环境:win10(64位)GPU: GTX1080TiCUDA:9.0Cudnn:9.0 (https://download.csdn.net/download/weixin_34...原创 2018-06-18 21:24:21 · 2257 阅读 · 0 评论 -
《TensorFlow实战》&《TensorFlow实战Google深度学习框架》
《TensorFlow实战》 《TensorFlow实战Google深度学习框架》 书的大体框架以讲解demo为主,大部分时间都在讲解不同的demo,而这些demo基本都是来源于TensorFlow的开源实现https://github.com/tensorflow/models中的内容 虽然不是特别系统,书中还是仍然简单而系统性的介绍TensorFlow中常用的基本概念,像:计算...转载 2018-08-15 19:28:14 · 274 阅读 · 0 评论 -
CNN用于句子分类时的超参数调试经验
根据“A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classification”这篇paper得到的经验。这篇paper的主要工作是对“Convolutional Naural Networks for Sentence Classificati...原创 2018-08-31 15:07:47 · 703 阅读 · 0 评论 -
加载GloVe模型和Word2Vec模型
1 Google用word2vec预训练了300维的新闻语料的词向量googlenews-vecctors-negative300.bin,解压后3.39个G。可以用gensim加载进来,但是需要内存足够大。#加载Google训练的词向量import gensimmodel = gensim.models.KeyedVectors.load_word2vec_format('Go...原创 2018-08-29 14:07:45 · 4387 阅读 · 0 评论 -
Git更新本地项目至Github
第一步:打开Github网站:https://github.com/,登录自己的账号。第二步:如下图所示,点击Your profile,进入仓库管理:第三步:如下图所示,新建仓库:仓库命名Test:仓库创建成功:上图已经写清楚了Github上传项目的方法,有两种方法:一种通过https,一种通过ssh。我刚开始是使用ssh的方法,不过一直报错,就直接换了...原创 2018-08-29 14:42:30 · 4831 阅读 · 0 评论 -
采用Pycharm上传项目到GitHub
pycharm中设置在pycharm需要配置github的账户名和密码,以及要提交的仓库,具体操作如下File-settings 在搜索框输入git如上面图所示,搜索框会出现github,然后在旁边输入你github的用户名和密码,可以点击”test”测试一下,如果出现:Connection successful 说明连接成功。(注意!!!这里using ssh最好不选,否则出现...原创 2018-08-29 20:02:33 · 526 阅读 · 0 评论 -
GitHub中README.md文件的编辑和使用
参考链接:https://blog.csdn.net/ljc_563812704/article/details/53464039原创 2018-08-29 20:24:31 · 1318 阅读 · 0 评论 -
使用tensorflow-gpu时设置GPU
使用GPU跑tensorflow程序,默认加载所有的GPU,但计算过程中只会用其中一块。也就是你看着所有GPU都被占用了,以为是在GPU并行计算,但实际上只有其中一块在运行;另外的所有显卡都闲着,但其显存都被占用了,所以别人也用不了。不过这种情况通过在程序之前加三行代码就可以解决:import osos.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"...原创 2018-09-02 14:31:34 · 5762 阅读 · 0 评论 -
论文Multi-Perspective Sentence Similarity Modeling with Convolution Neural Networks实现之数据集制作
1.数据集本文采用的是STS数据集,如下图所示,包括所有的2012-2016年的数据,而all文件夹包含2012-2015的所有数据。每一个文件的具体数据如下所示,每一行为一个三元组:<相似性得分,句子1,句子2>.在实现时将all文件夹中的所有数据当作训练集,将2016年的文件当作测试集。1.1数据读取采用以下代码进行单个文件的数据读取:"""读取一...原创 2018-09-03 16:21:48 · 475 阅读 · 1 评论 -
未来已来,你是否已准备好?
如今AI浪潮席卷各个领域,让国内社会各界都随之发生转型。下面,根据Gartner(全球最具权威的信息化咨询研究机构)发布的《Hype Cycle for ICT in China, 2019》行业报告,来研究分析中国通信技术领域的发展趋势。本次Gartner报告中给出两张趋势图表:Hype Cycle(技术成熟度曲线)和Priority Matrix(优先矩阵),看懂这两张图表,报告中提到的2...原创 2019-10-09 17:38:15 · 382 阅读 · 0 评论