![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 80
Hhhy云帆
Keep simple things simple.
展开
-
Pytorch torch.optim.lr_scheduler API如何调整学习率
pytorch 学习率相关API原创 2022-07-29 11:00:36 · 791 阅读 · 1 评论 -
自然语言处理领域的相关干货整理
自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。本文作者为NLP初学者整理了一份庞大的自然语言处理领域的概览。选取的参考文献与资料都侧重于最新的深度学习研究成果。这些资源能为想要深入钻研一个NLP任务的人们提供一个良好的开端。论文自动评分论文:Automatic Text Scoring Using Neural Networks...原创 2018-04-09 14:42:06 · 2282 阅读 · 0 评论 -
OCR技术原理
OCR技术原理文档识别技术功能特点图像输入:读取不同图像格式文件的算法。图像预处理:主要包括图像二值化,噪声去除,倾斜较正等算法。版面分析:将文档图片分段落,分行的算法就叫版面分析算法。字符切割:字符切割算法主要处理因字符粘连、断笔造成字符难以简单切割的问题。字符特征提取:对字符图像提取多维的特征用于后面的特征匹配模式识别算法。字符识别:将当前字符提取的特征向量与特征模板库进行模板...原创 2018-04-18 16:47:04 · 10610 阅读 · 0 评论 -
coco数据集下载脚本
#!/usr/bin/env bashmkdir datawget http://msvocds.blob.core.windows.net/annotations-1-0-3/captions_train-val2014.zip -P ./data/wget http://images.cocodataset.org/zips/train2014.zip -P ./data/wget h...原创 2018-08-13 10:22:34 · 1139 阅读 · 0 评论 -
Models/Tutorials/image/mnist模块源码分析之(一)
# Copyright 2015 The TensorFlow Authors. All Rights Reserved.## Licensed under the Apache License, Version 2.0 (the "License");# you may not use this file except in compliance with the License.# Y...原创 2018-07-20 12:07:08 · 277 阅读 · 0 评论 -
强化学习入门之基本介绍(一)
1. 什么是RL强化学习( RL )是机器学习的一个分支,agent通过与环境(env)交互来进行学习。这是一个以目标为导向的学习过程,agent不被告知要采取什么行为(action);相反,agent从其行为(action)的结果中学习。它正以各种各样的算法(DQN, A3C, DDPG, TRPO等)迅速发展,是目前人工智能( AI )最活跃的研究领域之一。agent可以探索(expl...原创 2018-07-14 16:07:57 · 1371 阅读 · 0 评论 -
Ubuntu16.04配置CUDA9.0和cudnn
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1sudo sh cuda_9.0.176_384.81_linux.runaccept no yes yes yes yessudo gedit ~/.bashrc 文件的末尾...原创 2018-07-12 19:48:05 · 417 阅读 · 0 评论 -
UnknownError (see above for traceback): exceptions.AttributeError: 'module' object has no attribute
./scripts/test.sh 0 ./models/seglink-512/model.ckpt-217867 ./datasets/ICDAR2015/Challenge4/ch4_test_images+ set -e+ export CUDA_VISIBLE_DEVICES=0+ CUDA_VISIBLE_DEVICES=0+ CHECKPOINT_PATH=./models/...原创 2018-07-02 12:06:14 · 1452 阅读 · 0 评论 -
RGB转灰度图
#coding:utf-8import numpy as npimport cv2# 首先以灰色读取一张照片src = cv2.imread("001.jpg", 0)# 然后用ctvcolor()函数,进行图像变换。src_RGB = cv2.cvtColor(src, cv2.COLOR_GRAY2BGR)# 显示图片#cv2.imshow("input", src)#...原创 2018-05-22 00:02:24 · 822 阅读 · 0 评论 -
Keras优化函数解析
from __future__ import absolute_importimport siximport copyfrom six.moves import zipfrom . import backend as Kfrom .utils.generic_utils import serialize_keras_objectfrom .utils.generic_utils im...原创 2018-04-26 10:18:21 · 2007 阅读 · 0 评论 -
CUDA安裝
CUDA安裝原创 2018-04-20 14:22:43 · 154 阅读 · 0 评论 -
txt2xml.py文件
from xml.dom import minidomimport cv2import ospath = '/home/hy/work/OCR_Detection_Simple/data/label'setname = set([i.split('.')[0] for i in os.listdir(path)])for i in setname: txt_dirtory = ...原创 2018-09-03 18:48:19 · 837 阅读 · 1 评论 -
ModuleNotFoundError: No module named 'gluoncv'报错
---------------------------------------------------------------------------ModuleNotFoundError Traceback (most recent call last)<ipython-input-34-edd286ee72a3> in <mod...原创 2019-01-09 22:00:40 · 4344 阅读 · 0 评论 -
Sequence to Sequence Learning with Neural Networks论文翻译
Sequence to Sequence Learningwith Neural Networks论文翻译摘要1. 导言2. 模型3. 实验3.1 数据集详细信息3.2 解码和重新评分3.3 反转源语句3.4 训练详情3.5 并行化3.6 实验结果3.7 长句子的表现3.8 模型分析4. 相关工作5. 结论6. 致谢引用摘要深度神经网络是在困难的学习任务中取得卓越性能的强大模型。尽管拥有大量的...原创 2019-04-25 17:04:26 · 4011 阅读 · 1 评论 -
TensorFlow Datasets简介
公共数据集为机器学习研究的快速发展提供了动力,但仅仅将这些数据集放入机器学习管道仍然太困难了。 每个研究人员都经历了编写一次性脚本以下载和准备他们使用的每个数据集的痛苦,这些数据集都具有不同的源格式和复杂性。今天,我们很高兴推出TensorFlow Datasets(GitHub),它将公共研究数据集公开为tf.data.Datasets和NumPy数组。 它完成了获取源数据并将其准备为磁盘上...原创 2019-03-19 16:06:39 · 7481 阅读 · 0 评论 -
tf.keras损失函数总结
tf.keras损失函数一览keras.losses.mean_squared_errorkeras.losses.mean_absolute_errorkeras.losses.mean_absolute_percentage_errorkeras.losses.mean_squared_logarithmic_errorkeras.losses.squared_hingekera...原创 2019-02-26 15:54:08 · 6589 阅读 · 0 评论 -
COCO-trained models
COCO-trained models Model name Speed (ms) COCO mAP[^1] Outputs ssd_mobilenet_v1_coco 30 21 Boxes ssd_inception_v2_coco 42 24 Boxes faster_rcnn_inception_v2_coco ...原创 2018-04-04 11:12:50 · 2803 阅读 · 4 评论 -
darknet识别车辆案例
darknet_truck1. 用darknet识别卡车 汽车 巴士和人案例* 我使用的是GPU训练的数据在Makefile中调整 GPU=1 CUDNN=1* export PATH=/usr/local/cuda-8.0/bin/:$PATH* export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH...原创 2018-03-28 16:25:07 · 2164 阅读 · 0 评论 -
yolov3报错
hy@hy-desktop:~/2018-ocr/darknet$ ./darknet detector train cfg/voc.data cfg/yolov3.cfg darknet19_448.conv.23 yolov3layer filters size input output 0 conv 3...原创 2018-04-08 11:10:53 · 1938 阅读 · 4 评论 -
ubuntu16.04 安装pip install torch 出错
hy@hy-desktop:/devdata/$ pip install torch Collecting torch Using cached torch-0.1.2.post1.tar.gz Complete output from command python setup.py egg_info: Traceback (most recent call last)...原创 2018-03-07 19:31:54 · 2397 阅读 · 2 评论 -
NMS-非极大值抑制
非极大值抑制算法(Non-maximum suppression, NMS)的本质是搜索局部极大值,抑制非极大值元素。目标检测中应用NMS算法的主要目的是消除多余(交叉重复)的窗口,找到最佳物体检测位置。目标检测可能会出现的一个问题是,模型会对同一目标做出多次预测,得到多个BBox。NMS旨在保留最接近真实包围盒(ground truth)的那一个预测结果,而抑制其他的预测结果。NMS的做原创 2018-01-24 11:10:41 · 677 阅读 · 0 评论 -
Show and Tell: A Neural Image Caption Generator(图文转换)
在”Show and Tell: Lessons learned from the 2015 MSCOCO Image Captioning Challenge.“这篇论文中用TensorFlow实现了图文模型的转换,作者是Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan。Show and Tell模型是一个深度神经网络,学习如原创 2017-12-25 18:41:31 · 3107 阅读 · 0 评论 -
强化学习的分类
on-policy: 必须本人在场, 并且一定是本人边玩边学习,例如Sarsa,Sarsa(lambda),TRPO。off-policy: 可以选择自己玩, 也可以选择看着别人玩, 通过看别人玩来学习别人的行为准则,例如Q-learning,DQN,Deterministic policy gradient。 on-policy和off-policy本质区别在于:更新Q值的时候是使用既定策略原创 2017-12-01 17:55:57 · 2059 阅读 · 0 评论 -
tensorflow实现Linear Regression
""" Simple linear regression example in TensorFlowThis program tries to predict the number of thefts from the number of fire in the city of ChicagoAuthor: Chip HuyenPrepared for the class CS 20SI:原创 2017-08-30 00:00:34 · 353 阅读 · 0 评论 -
tensorflow术语
广播操作(Broadcasting operation) 一种用numpy-style broadcasting来保证tensor参数的形态兼容的操作。Devices 一块可以用来运算并且拥有自己的地址空间的硬件,比如GPU和CPU。eval Tensor 的一个方法,返回 Tensor 的值。触发任意一个图计算都需要计算出这个值。只能在一个已经启动的会话的图中才能调用该 Tensor 值原创 2017-08-29 22:25:15 · 309 阅读 · 0 评论 -
tensorflow data type
数据类型 Python 类型 描述 DT_FLOAT tf.float32 32 位浮点数. DT_DOUBLE tf.float64 64 位浮点数. DT_INT64 tf.int64 64 位有符号整型. DT_INT32 tf.int3...原创 2017-08-29 20:49:12 · 517 阅读 · 0 评论 -
tensorflow 之常量和变量
import tensorflow as tf#创建变量state = tf.Variable(0, name='counter')#print(state.name)#定义一个常量one = tf.constant(1)new_value = tf.add(state, one)#tf.assign(state, new_value): 这个函数的功能主要是把state的值变为new_v原创 2017-08-22 14:26:52 · 536 阅读 · 1 评论 -
查看CUDA和cudnn版本
tb@tb:~/work/OCR$ cat /usr/local/cuda/version.txtCUDA Version 8.0.61tb@tb:~/work/OCR$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2#define CUDNN_MAJOR 5#define CUDNN_MINOR ...原创 2018-03-08 16:49:08 · 1200 阅读 · 0 评论 -
ubuntu16.04 ImportError: No module named caffe
使用python调用caffe时,在相应的.py文件的最前面加入:caffe_root = '/devdata/AI/OCR/caffe/'import syssys.path.insert(0, caffe_root + 'python')import caffe原创 2018-03-08 18:56:34 · 2515 阅读 · 0 评论 -
Tensorflow-wavenet生成模拟声音
1.wavenet wave介绍:https://deepmind.com/blog/wave … udio/ 先用一个短视频介绍一下wavenet效果 http://v.qq.com/x/page/w0328zc2azc.html2.下载tensorflow-wavenet 读者自己先配置好tensorflow git clone –recursive https://github...转载 2018-03-14 11:00:32 · 6107 阅读 · 1 评论 -
wavenet总结
文字生成图像生成声音生成原创 2018-03-14 10:55:43 · 1542 阅读 · 0 评论 -
ubuntu16.04 libcublas.so.9.0: cannot open shared object file: No such file or directory报错
解决办法: tensorflow版本是1.6 ,需要支持CUDA9.0 高于我的CUDA版本,所以重新安装低版本的tensorflow sudo pip3 install tensorflow-gpu==1.4 -i https://pypi.tuna.tsinghua.edu.cn/simple/ 使用国内源安装速度会快些Traceback (most recent call las...原创 2018-03-13 17:41:18 · 962 阅读 · 0 评论 -
Google最新语义图像分割模型DeepLab-v3+
paper地址: https://arxiv.org/abs/1802.02611 GitHub 地址:https://github.com/tensorflow/models/tree/master/research/deeplab摘要:深度神经网络使用空间金字塔池化模块或编码器-解码器结构执行语义分割任务。前者通过在多个 rate、多个有效视野上用滤波器探测输入特征或执行池化操作,来编码...转载 2018-03-13 17:35:30 · 1961 阅读 · 0 评论 -
ubuntu16.04 tensorflow 报错 ImportError: cannot import name 'audio_ops'
Traceback (most recent call last): File "train.py", line 81, in <module> import input_data File "/devdata/AI/DL/tensorflow/tensorflow/examples/speech_commands/input_data.py", line 35,...原创 2018-03-13 14:33:25 · 3723 阅读 · 0 评论 -
Object Detection Paper
YOLO9000: Better, Faster, Stronger[J] (2016), Redmon J, Farhadi A. pdfYou only look once: Unified, real-time object detection (2016), J. Redmon et al. pdfFully convolutional networks for semantic s...原创 2018-02-24 16:57:47 · 347 阅读 · 0 评论 -
CNN paper总结
Rethinking the inception architecture for computer vision (2016), C. Szegedy et al. pdfInception-v4, inception-resnet and the impact of residual connections on learning (2016), C. Szegedy et al. pdf...原创 2018-02-24 16:50:02 · 521 阅读 · 0 评论 -
深度强化学习简要概述(A brief Survey of deep reinforcement learning)
深度强化学习简要概述作者:Kai Arulkumaran, Marc Peter Deisenroth, Miles Brundage, Anil Anthony Bharathpaper地址: A brief Survey of deep reinforcement learning摘要深度强化学习(DRL)将为人工智能领域带来革命性的变化,并代表着朝向构建对视觉世界...原创 2018-03-09 23:52:42 · 12244 阅读 · 1 评论 -
pip通过国内源快速安装包
这里使用的是清华大学源pip install easydict -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip install keras==2.0.8 -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip install Cython opencv-python -i https://p...原创 2018-03-09 13:40:32 · 3642 阅读 · 0 评论 -
tensorflow实现简单的矩阵相乘
from __future__ import print_functionimport tensorflow as tfmatrix1 = tf.constant([[3, 3]])matrix2 = tf.constant([[2], [2]])product = tf.matmul(matrix1, matrix2) # matrix mul原创 2017-08-22 14:19:57 · 1212 阅读 · 0 评论