X. Zhou-CSDN博客

原创 tensorflow Dataset及TFRecord一些要点【持续更新】

关于tensorflow结合Dataset与TFRecord这方面看到挺好一篇文章：https://cloud.tencent.com/developer/article/1088751github：https://github.com/YJango/TFRecord-Dataset-Estimator-API/blob/master/TensorFlow%20Dataset%20...

2019-12-22 19:38:00 129

原创 tensorflow与神经网络中遇到的问题与解决方法【持续更新】

1、如何在全连接层拼接特征？有一种方法是有两个input，一个input通过网络最终达到全连接层，另一个input直接接一个全连接网络，神经元数是特征数，这两个可以进行一个concat。当然了也可以直接输入特征concat到全连接层，但是据说前者效果要好一点。2、word2vec词向量如何在网络中更新？在我的一个模型中(网络层次较浅)，我用word2vec词向量的效果比之用随机...

2019-07-23 23:28:00 296

原创科研与工作中一些常用快捷键和命令记录【持续更新】

1、ctrl+shift+a：有时候在做nlp任务嘛…一个文本中有100多w条数据，想要选中一批连续的数据的时候，键盘上同时按住ctrl+shift+a，然后鼠标点击一下开始的地方，再拉到结束的地方点击一下，这个区间就被选出来了，win10的文件系统也可以用这种方式选择多个连续的文件。2、按行打乱一个文件(shuffle)重新写入一个新的文件。命令：shuf input_file.t...

2019-07-01 14:47:00 141

原创 linux个人常用命令【持续更新】

2019-07-01 14:41:00 855

原创 centos + docker搭建深度学习环境以及一些问题解决

必须要说容器是一个很牛逼的思想！注意，是思想！也许docker有种种问题，但是不管docker能否茁壮地发展下去，未来这种方式的环境搭建一定会变得越来越流行！网上有很多这方面的教程，但大多数都不太好。。。。初学者很难上手看的一脸懵逼，而且很多自己都根本没验证过行不行，而且很多问题都没有提到！！因此我自己写一个这方面的教程，以后自己看起来方便，有缘的docker新手看到这篇文章也许能给你...

2019-06-27 18:07:00 351

原创 Docker基本使用

1、在已有的docker镜像的基础上加入一些自己的东西有时候我们从docker hub或者别人那边拿到docker镜像，我们自己跑一个容器，然后在容器里面我们更改了一些东西，比如docker里面是ubuntu的系统，我们apt-get install 了一个ssh，现在我们要更新一下这个镜像文件方便以后我们自己使用或者分享使用，这时候就要在一个基础的docker镜像的基础上更新一个新的...

2019-06-27 17:59:00 431

简单记录下，背景是在c++场景下做的一个功能需要用python做一下复现，其中有一个根据固定输入的哈希值作为种子取随机数（0-1之间的小数）的操作，需要python和c++保持完全一致。做法如下：保证哈希是一致的可以c++和python都是用cityhash64算法保证随机数算法是一致的，python的random算法用的是梅森旋转算法（用np.random.rand()，用random.random()生成的和c++对不上。。），c++也用对应的，std::mt19937。python

2022-05-18 01:39:42 1172

原创 Git团队开发快速操作

文章目录项目位于master分支项目位于非master分支项目位于master分支项目位于非master分支clone代码到本地：git clone xxxclone下来的是master分支，查看所有分支git branch -a找到远程分支，一般是remotes/origin开头的，例如remotes/origin/test切换到该分支 git checkout remotes/origin/test会提示你需要新建一个

2022-02-07 14:45:45 811

原创粗谈AUC计算方式

先占个位置REFhttps://www.jianshu.com/p/f9f8e29abbe0

2021-11-23 15:54:39 375

原创个人摄影相关小技巧

文章目录lr调色步骤lr调色步骤调整白平衡。吸一下图片中想要参照的白色部分，他会自动调整色温和色调看看是否合适，不合适的话还是自己再调调。调整基础曝光度和对比度。镜头校正（这个一般的都默认选上了）去除暗角色调曲线...

2021-05-13 21:55:45 234

原创 mac使用及配置环境记录

最近换mac了，准备记录一下自己需要用到的一些配置过程。1. item2官网下载安装。 item2是一个类似mac自带终端的东西，稍微美化了一些，多一些功能。（后面给的网址看一下安装item2部分就行） https://www.jianshu.com/p/2ebbc4a6df522. zsh命令行美化工具，一般用linux的同学们都会用到。一般情况下安装zsh就是：sh -c “$(curl -fsSL https://raw.githubusercontent.com/ohmyzsh/ohmy

2021-04-26 21:11:22 676

原创 mac 干净地安装ps+lr

注：本人mac系统10.15，暂未升级big sur。1. creative cloud从官网下载或者学校/企业提供的安装包下载creative cloud并安装，安装后登陆账号（若正版用户）。进入creative cloud中安装photoshop和lightroom classic最新版。此时launchpad里会出现N多app，如下：2. 卸载creative cloud卸载起来还是挺麻烦的，首先根据官方的解决方案下载一个creative cloud卸载器，具体见：https://helpx

2021-04-20 20:32:28 1468 1

原创基于docker的python faster-rcnn caffe环境搭建+提取目标特征实验

文章目录1. 环境配置前言2. 下载caffe镜像3. 下载bottom-up-attention代码以及编译起初是为了使用faster-rcnn的目标提取功能提取图片中的目标特征，供后续模型学习，有一个比较好的实现bottom up attention，其为py-faster-rcnn在 Visual Genome 数据集预训练的模型,官方py-faster-rcnn在COCO数据集预训练下仅识别80个class，bottom up attention可识别1600个object class以及400个

2021-01-19 20:41:49 994 4

原创一些可能会用到的深度学习技巧函数(持续更新)

目录部分加载参数部分加载参数def smart_partial_load_model_state_dict(model, state_dict): # 有时候加载的.model模型包含了一些面向下游的全连接层参数我们用不到，有时候.py架构文件中有些需要加载的参数.model模型文件里又没有，解决这种不匹配问题 parsed_state_dict = {} non_match_keys = [] pretrained_keys = [] for k, v in s

2021-01-12 17:17:56 307 1

转载 BLEU，ROUGE，METEOR，ROUGE-浅述自然语言处理机器翻译常用评价度量

BLEU，ROUGE，METEOR，ROUGE 浅述自然语言处理机器翻译常用评价度量客观评价指标 – BLEU – ROUGE – METEOR – CIDEr主观评价指标 – 流畅度 – 相关性 – 助盲性客观评价指标实际上可以看出由于最后生成的目标...

2020-12-11 14:32:20 565

原创 tensorflow对多维tensor按照指定索引重排序

背景是这样的，比如我有一个张量data，shape是(batch_size，100，128)我还有一个张量inc，shape是(batch_size，100)我现在想根据这个张量地索引来对data重排序。为什么会有这样地需求呢，是因为比如data是数据，100代表数据步长，128代表数据内units数目(维度)，inc代表一个分数，这个分数表明了这100个步长当中每一步的重要性。...

2020-01-16 20:24:00 1175 1

原创 RNN、LSTM介绍以及梯度消失问题讲解

写在最前面，感谢这两篇文章，基本上的框架是从这两篇文章中得到的：https://zhuanlan.zhihu.com/p/28687529https://zhuanlan.zhihu.com/p/28749444这部分是我给组内的同学做的一个分享PPT，在这里记录一下。...

2019-09-28 19:40:00 171

原创使用BERT模型生成句子序列向量

之前我写过一篇文章，利用bert来生成token级向量(对于中文语料来说就是字级别向量)，参考我的文章：《使用BERT模型生成token级向量》。但是这样做有一个致命的缺点就是字符序列长度最长为512(包含[cls]和[sep])。其实对于大多数语料来说已经够了，但是对于有些语料库中样本的字符序列长度都比较长的情况，这就有些不够用了，比如我做一个法院文书领域预测任务，里面的事实部分许多都...

2019-08-28 12:22:00 1989 1

原创给定数字N，输出小于10^N的所有整数

讲起来比较简单，从0到N遍历输出就行了，但是如果N非常大，就涉及整数溢出问题，很明显是一个全排列问题，也就是输出N，代表N位上所有的数字取值是0-9，做一个全排列，还需要考虑的就是对于0001，0068，0977类似这种前面有0的情况输出的时候需要去除掉。就是一个基础的递归求全排列问题，当然也可以不用递归用栈来解决，这里给出了一个递归的java版本。public class Tes...

2019-08-23 19:55:00 284

原创使用BERT模型生成token级向量

本文默认读者有一定的Transformer基础，如果没有，请先稍作学习Transormer以及BERT。相信网上有很多方法可以生成BERT向量，最有代表性的一个就是bert as service，用几行代码就可以生成向量，但是这样生成的是句向量，也就是说，正确的做法是输入一句句子：我是一个中国人，我热爱着中国的每一个城市。输出的是这句句子的向量，一个768维的向量(google预训...

2019-08-23 00:53:00 2184

原创使用BERT预训练模型+微调进行文本分类

本文记录使用BERT预训练模型，修改最顶层softmax层，微调几个epoch，进行文本分类任务。BERT源码首先BERT源码来自谷歌官方tensorflow版：https://github.com/google-research/bert注意，这是tensorflow 1.x 版本的。BERT预训练模型预训练模型采用哈工大讯飞联合实验室推出的WWM(Whole Word Ma...

2019-08-20 17:15:00 3640 3

原创 gensim中word2vec和其他一些向量的使用

直接上代码吧，word2vec# testfrom gensim.models.word2vec import Word2Vectxt_file = open('data.txt')sentences = []line = txt_file.readline()while line: sentence = line.split(' ') sentences....

2019-07-01 17:40:00 161

原创 python在算法题中判断输入结束(EOF)

有些算法题是这样要求的，一行输入一行数据，然后没有规定我要输入多少行，你要自行判断文件结束EOF，否则是会runtime error的，因为oj内部都是用文件来进行读写的。例如a+b，每一行输入a b，计算a+b的结果。一般这种嘛，c/c++很简单了，就是scanf判断一下!=EOF就完事了，但是python中没有这种操作，需要另外的操作。这里介绍一些目前我掌握的有三种方法：用异常...

2019-07-01 14:42:00 3339

原创 python 多分类任务中按照类别分层采样

在机器学习多分类任务中有时候需要针对类别进行分层采样，比如说类别不均衡的数据，这时候随机采样会造成训练集、验证集、测试集中不同类别的数据比例不一样，这是会在一定程度上影响分类器的性能的，这时候就需要进行分层采样保证训练集、验证集、测试集中每一个类别的数据比例差不多持平。下面python代码。# 将数据按照类别进行分层划分def save_file_stratified(filen...

2019-07-01 14:40:00 861

原创 ubuntu安装anaconda3+tensorflow(cpu)+pycharm(windows几乎一样)

网上乱七八糟有的都是别人怎么写自己也怎么写，其实很简单。首先是anaconda3的安装：直接上官网：https://www.anaconda.com/download/下载下来之后进入文件所在目录，复制一下那个文件的名字，然后：bash xxxxxxxxxxx.sh文件名字一定不能打错了！！这里需要注意一点！直接点安装的话安装的是最新版的anaconda，比如我安装的anac...

2019-07-01 14:16:00 104

原创 ubuntu18 搭建ftp服务器，以及文件目录权限问题

有时候呢我们有一台本地的台式机或者云服务器，我们想要搭个ftp服务器好让我们在内网/外网中方便的传输、保存文件，这样别的任何电脑啊，设备啊，只要访问这个ftp的地址，就可以进行文件传输啦！由于我现在台式机子是实验室里的，网络是学院的网划分的虚拟子网，对外公网ip只有一个，所有实验室内连接不同网线的电脑、设备的公网ip都是那一个，因此我只能暂时搭个内网ftp方便我传输文件。我的台式机子上装...

2019-07-01 14:15:00 789

原创 Transformer解析与tensorflow代码解读

本文是针对谷歌Transformer模型的解读，根据我自己的理解顺序记录的。另外，针对Kyubyong实现的tensorflow代码进行解读，代码地址https://github.com/Kyubyong/transformer这里不会详细描述Transformer的实现机理，如果有不了解Transformer的可以先阅读文章《Attention is all you need》，以...

2019-06-30 15:55:00 1531 1

原创【转】如何在TensorFlow中高效使用数据集

本文主要记录tensorflow一个比较好用的API：Dataset，feed-dict 是向 TensorFlow 传递信息最慢的方式，应该尽量避免使用。向模型提供数据的正确方式是使用输入管道，这样才能保证 GPU 在工作时永远无需等待新的数据。文章链接：https://www.jiqizhixin.com/articles/03137这也是最近在研究Kyubyong的新版Tran...

2019-06-26 15:08:00 128

原创 Linux服务器重启后nvidia-smi无法使用的解决方法

服务器上的nvidia显卡驱动用的好好的，突然有一天，服务器断电了，然后恢复之后发现常用的nvidia-smi命令无法使用了，具体显示什么无法建立和驱动器的通信之类的，上网查了一堆，发现问题的核心：linux服务器重启之后有时候内核更新了，这时候系统会自动更新内核，那么原来的nvidia驱动器的版本就跟不上内核的版本了。自己设置启动内核是一种解决方法，另一种解决办法是更新nvidia驱动...

2019-06-23 15:50:00 1666

原创短文对话的神经反应机 -- Neural Responding Machine for Short-Text Conversation学习笔记

　　最近学习了一篇ACL会议上的文章，讲的是做一个短文对话的神经反映机，　　原文：　　会议：ACL(2015)　　文章条目： Lifeng Shang, Zhengdong Lu, Hang Li:　　Neural Responding Machine for Short-Text Conversation. 1577-1586　　写下学习笔记：　　拓展：Attenti...

2017-12-06 17:01:00 270

原创卷积神经网络用语句子分类---Convolutional Neural Networks for Sentence Classification 学习笔记...

　　读了一篇文章，用到卷积神经网络的方法来进行文本分类，故写下一点自己的学习笔记：　　本文在事先进行单词向量的学习的基础上，利用卷积神经网络(CNN)进行句子分类，然后通过微调学习任务特定的向量，提高性能。　　在从无监督神经语言模型中获得单词向量(Tomas Mikolov等人做过相关工作，即谷歌的word2vector完成，将原始的1/V模型变化为分布式低维表示)后利用一层卷积层的...

2017-12-06 16:53:00 174

原创初窥图像识别与k-means算法

　　前段时间做了一个车型识别的小项目，思路是利用k-means算法以及词袋模型来做的。　　近年来图像识别的方法非常非常多，这边只记录一下我那个项目的思路，核心思想是k-means算法和词汇树。　　很遗憾没有做详尽的开发前的思路文档，只能按照记忆进行大致总结。　　项目分为三大模块：特征点抽取、训练词汇树、识别(利用训练好的词汇树)。　　首先是特征点的抽取。我是用的OpenCV的框架...

2017-11-07 11:47:00 338

原创 java 操作格子问题（线段树）

　　很久之前做过线段树的问题(操作格子)，时间长了之后再次接触到，发现当初理解的不是很透彻，然后代码冗长，再遇到的时候发现自己甚至不能独立地完成这个问题。　　所以算法这个东西啊，　　第一，是要经常练习(我个人认为…每一个程序员都不应该不擅长算法…从今天开始，要常写博客！)。　　第二，是一定要理解透彻，理解透彻并不是说到网上找到了解答，然后自己照着能够运行出来，这样是不够的！甚至不是说...

2017-05-26 22:35:00 195

原创 Java一点输入输出技巧

输入：格式1：Scanner sc = new Scanner(System.in);格式2：Scanner sc = new Scanner(new BufferedInputStream(System.in));数据量大时，格式2更快。Split方法：String str = scanner.next();String[] date = str.split("/");S...

2017-05-26 22:22:00 129

原创分酒问题（DFS解法）

题目大概是这样：已知有三个容量分别为3千克、5千克和8千克的并且是没有刻度的酒瓶，3千克和5千克的瓶子均装满了酒，而8千克的瓶子为空。现要求仅用这三个酒瓶将这些酒均分为两个4千克并分别装入5千克和8千克的瓶子中。题解：可以扩展为有n个瓶子，每个瓶子当前装了x1,x2,x3…xn的酒，每个瓶子的上限是y1,y2,…yn，目标状态是每个瓶子d1,d2,…dn，现在要从当前状态转换到目标...

2017-05-07 20:45:00 549

原创关于C++中vector和set使用sort方法进行排序

C++中vector和set都是非常方便的容器，sort方法是algorithm头文件里的一个标准函数，能进行高效的排序，默认是按元素从小到大排序将sort方法用到vector和set中能实现多种符合自己需求的排序首先sort方法可以对静态的数组进行排序1 #include<iostream>2 using namespace std;3 int main(){...

2016-06-04 00:31:00 472

原创 L2-006.树的遍历

给定一棵二叉树的后序遍历和中序遍历，请你输出其层序遍历的序列。这里假设键值都是互不相等的正整数。输入格式：输入第一行给出一个正整数N(<=30)，是二叉树中结点的个数。第二行给出其后序遍历序列。第三行给出其中序遍历序列。数字间以空格分隔。输出格式：在一行中输出该树的层序遍历的序列。数字间以1个空格分隔，行首尾不得有多余空格。输入样例：72 3 1 5 7 6 41 2 3...

2016-06-02 23:50:00 131

原创 L2-2. 链表去重

L2-2. 链表去重时间限制300 ms内存限制65536 kB代码长度限制8000 B判题程序Standard作者陈越给定一个带整数键值的单链表L，本题要求你编写程序，删除那些键值的绝对值有重复的结点。即对任意键值K，只有键值或其绝对值等于K的第一个结点可以被保留。同时，所有被删除的结点必须被保存在另外一个链表中。例如：另L为21→-15→-15→-7→15，则你必须输出去重后的链表...

2016-06-02 00:17:00 133

原创蓝桥杯-算法训练--ALGO-8 操作格子

问题描述有n个格子，从左到右放成一排，编号为1-n。共有m次操作，有3种操作类型：1.修改一个格子的权值，2.求连续一段格子权值和，3.求连续一段格子的最大值。对于每个2、3操作输出你所求出的结果。输入格式第一行2个整数n，m。接下来一行n个整数表示n个格子的初始权值。接下来m行，每行3个整数p,x,y，p表示操作类型，p=1时表示修改格子x的权值为y，p=2时表示求...

2016-03-21 11:13:00 120

原创蓝桥杯-算法训练--ALGO-6 安慰奶牛

问题描述Farmer John变得非常懒，他不想再继续维护供奶牛之间供通行的道路。道路被用来连接N个牧场，牧场被连续地编号为1到N。每一个牧场都是一个奶牛的家。FJ计划除去P条道路中尽可能多的道路，但是还要保持牧场之间的连通性。你首先要决定那些道路是需要保留的N-1条道路。第j条双向道路连接了牧场Sj和Ej(1 <= Sj <= N; 1 <= Ej <= N;...

2016-03-21 11:04:00 159

空空如也

空空如也