自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ch的专栏

你必须非常努力,才能看起来毫不费力。。。

转载 自然语言处理中的语言模型预训练方法(ELMo、GPT和BERT)

自然语言处理中的语言模型预训练方法(ELMo、GPT和BERT) 最近,在自然语言处理(NLP)领域中,使用语言模型预训练方法在多项NLP任务上都获得了不错的提升,广泛受到了各界的关注。就此,我将最近看的一些相关论文进行总结,选取了几个代表性模型(包括ELMo [1],OpenAI GPT [2...

2020-03-15 16:23:39 163 0

转载 爱奇艺视频标签技术解析

本文转载自:https://mp.weixin.qq.com/s/gTdVJs8PEzy-8fbYfXOrHA 前言 随着短视频的兴起,每天有大量的短视频被生产并上传到各大视频平台,面对海量的短视频,如何提升这些短视频的智能分发效率是各大短视频平台面临的重要课题。 视频的标签技术是内容理解的...

2020-02-27 16:05:54 473 0

转载 AC自动机 算法详解(图解)及模板

本文转载自:https://blog.csdn.net/bestsort/article/details/82947639 要学AC自动机需要自备两个前置技能:KMP和trie树(其实个人感觉不会kmp也行,失配指针的概念并不难) 其中,KMP是用于一对一的字符串匹配,而trie虽然能用于多模式...

2020-01-03 11:28:57 54 0

原创 ALBERT 思想简介

前段时间简单看了下ALBERT 的paper(ALBERT: A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS), 简单记录下论文的思想,穿插一点点个人想法。 1 背景 1.1 从BERT以来...

2019-11-29 12:01:30 288 0

转载 ELECTRA:超越BERT,19年最佳NLP预训练模型

本文转载自:https://mp.weixin.qq.com/s/gqc3jKB33mvMKyGXUFTBdw BERT推出这一年来,除了XLNet,其他的改进都没带来太多惊喜,无非是越堆越大的模型和数据,以及动辄1024块TPU,让工程师们不知道如何落地。 今天要介绍的ELECTRA是我...

2019-11-29 11:05:24 115 0

原创 Mac下Iterm2 分屏命令

⌘ + d: 垂直分屏 (将屏幕分成左右) ⌘ + shift + d: 水平分屏 (将屏幕分成上下) ⌘ + ]和⌘ + [在最近使用的分屏直接切换. ⌘ + opt + 方向键切换到指定位置的分屏 ...

2019-10-25 15:44:40 159 0

原创 通过 Dockerfile build镜像 挂载宿主机目录 及 一个有意思的bug

1 通过Dockerfile 构建docker镜像 docker build -t transformers_docker . 说明:通过docker build构建镜像,参数-t表示镜像的tag,transformers_docker 表示镜像的名称,. 表示当前目录,根据当前目录查找...

2019-09-27 17:58:28 932 0

转载 人脸检测论文:BlazeFace: Sub-millisecond Neural Face Detection on Mobile GPUs 及其Pytorch实现

参考链接:https://blog.csdn.net/shanglianlm/article/details/95809339

2019-08-27 14:38:11 155 0

转载 GAN原理,优缺点、应用总结

1.GAN的 ‘前世’? 大家都知道GAN是Ian Goodfellow 2 014年放出的一篇开山之作,在深度学习界评价很高,可以说GAN的出现,给深度学习界带来了很多的研究(shui)课(lun)题(wen)。但是如果说GAN是另外一种网络的变种,不知道你是否相信呢?但是有一个人是坚信不疑的...

2019-08-16 18:03:04 108 0

原创 docker 删除镜像

1 查询镜像 docker images 2 先查询该镜像启动的容器的 container id docker ps -a 3 首先根据容器id 删除容器 docker rm b5568112d262 4 根据镜像id image id 删除镜像 docker rmi e73...

2019-07-23 15:02:43 106 0

转载 Docker启动Get Permission Denied

以下问题及解决方法都在Ubuntu16.04下,其他环境类似 问题描述 安装完docker后,执行docker相关命令,出现 ”Got permission denied while trying to connect to the Docker daemon socket at unix...

2019-07-22 19:17:13 54 0

原创 Object of type 'ObjectId' is not JSON serializable

从 mongo 中直接将查到的数据 dumps 导出,报错: Object of type 'ObjectId' is not JSON serializable 解决方法: from bson import json_util json_util.dumps(da...

2019-07-18 16:29:01 760 0

转载 python--常用的十进制、16进制、字符串、字节串之间的转换

本文转载自:https://www.cnblogs.com/fqfanqi/p/7900758.html 进行协议解析时,总是会遇到各种各样的数据转换的问题,从二进制到十进制,从字节串到整数等等 整数之间的进制转换: 10进制转16进制: hex(16) ==> 0x10 16进制转...

2019-07-16 10:02:18 43 0

原创 视频抽取音频,对阿里 百度 腾讯 科大讯飞的语音识别进行评测

1 视频抽取音频 我手头的视频格式为 mov 或者 mp4格式的,需要首先从视频中抽取音频。 看了下各家对音频数据的格式要求,一般是 pcm/wav/amr/mp3 等,采样率 16k/8k, 位长 16bit,单声道。 用到的视频抽音频工具是 ffmpeg,这个没啥说的了。 针对...

2019-06-19 14:34:41 796 0

原创 使用numpy pandas 读取csv文件及遍历 && 二者处理数据时间对比

1 使用numpy 及 pandas 读取csv文件及遍历 1.1 numpy fin = np.loadtxt(self.path,dtype=np.str,delimiter=',') test_dict = {} data = fin...

2019-05-29 16:36:47 4147 0

转载 Python必会的单元测试框架 —— unittest

本文转载自:https://blog.csdn.net/huilan_same/article/details/52944782 unittest是xUnit系列框架中的一员,如果你了解xUnit的其他成员,那你用unittest来应该是很轻松的,它们的工作方式都差不多。 unittest核心...

2019-04-29 17:50:24 51 0

原创 rsync error: error in socket IO (code 10) at clientserver.c(128) [Receiver=3.1.1]

今天从一台新服务器上rsync 文件,已配置好/etc/rsyncd.conf 文件,拉取数据时报错:rsync error: error in socket IO (code 10) at clientserver.c(128) [Receiver=3.1.1]. 发现是待拉取机器的服务...

2019-04-22 19:07:39 4528 0

转载 以 linear_regression为例讲解神经网络实现基本步骤以及解读nn.Linear函数

参考: https://blog.csdn.net/dss_dssssd/article/details/83892824

2019-04-16 21:31:43 470 0

转载 关于深度学习优化器 optimizer 的选择

在很多机器学习和深度学习的应用中,我们发现用的最多的优化器是 Adam,为什么呢? 下面是 TensorFlow 中的优化器,https://www.tensorflow.org/api_guides/python/train 在 keras 中也有 SGD,RMSprop,Adagrad,A...

2019-04-16 16:46:54 110 0

转载 pytorch使用torch.dtype、torch.device和torch.layout管理数据类型属性

本文转载自:https://ptorch.com/news/187.html pytorch从0.4开始提出了Tensor Attributes,主要包含了torch.dtype,torch.device,torch.layout。pytorch可以使用他们管理数据类型属性。以下内容为pytor...

2019-04-16 15:00:44 3893 0

转载 mac 中将gitlab拉取代码到本地

步骤0: 安装git、注册/申请gitlab账号、生成key 这里只说明生成key 设置Git的user name和email: git config --global user.name "name" git config --global user.email ...

2019-04-13 15:39:36 2048 0

转载 损失函数loss总结

分类任务loss: 二分类交叉熵损失sigmoid_cross_entropy: TensorFlow 接口: tf.losses.sigmoid_cross_entropy( multi_class_labels, logits, weights=1.0, label_...

2019-03-29 19:31:33 330 0

原创 Dota中卡尔技能总数的组合数量

问题: 在游戏Dota2中,有一位非常强大的英雄:卡尔,他有三种属性:冰 火 雷. 同时卡尔身上有三个无顺序的属性槽, 他可以从三种属性中任意选择3个放入属性槽中,然后通过当前的属性组合召唤技能. 每种不同的属性组合 都可以为卡尔召唤出不同的技能,共有10种组合: 1 冰冰冰 2 冰冰火 ...

2019-03-21 19:34:35 1982 0

转载 『TensorFlow』网络操作API中损失函数及分类器

本文转载自:https://www.cnblogs.com/hellcat/p/7039482.html 目录 一、误差值 l2_loss 二、分类器 sigmoid_cross_entropy_with_logits softmax log_softmax softm...

2019-03-19 15:59:13 80 0

转载 机器学习中 L1 和 L2 正则化的直观解释

机器学习中,如果参数过多,模型过于复杂,容易造成过拟合(overfit)。即模型在训练样本数据上表现的很好,但在实际测试样本上表现的较差,不具备良好的泛化能力。为了避免过拟合,最常用的一种方法是使用使用正则化,例如 L1 和 L2 正则化。但是,正则化项是如何得来的?其背后的数学原理是什么?L1 ...

2019-03-11 17:04:11 129 0

转载 python结巴(jieba)分词

一、特点 1、支持三种分词模式:   (1)精确模式:试图将句子最精确的切开,适合文本分析。   (2)全模式:把句子中所有可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。   (3)搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 2、支持繁体分词 ...

2019-02-22 16:58:26 137 0

转载 在分类中如何处理训练集不均衡问题

本文转载自: https://blog.csdn.net/heyongluoyao8/article/details/49408131 文章翻译自Quora:  https://www.quora.com/In-classification-how-do-you-handle-an-unbala...

2019-02-20 10:44:55 208 0

转载 Hive常用函数大全一览

本文转载自: https://www.iteblog.com/archives/2258.html 文章目录 1 关系运算 1.1 1、等值比较: = 1.2 2、不等值比较: 1.3 3、小于比较: < 1.4 4、小于等于比较: <= 1.5...

2019-02-18 20:57:22 902 0

转载 redis数据库命令快查表

本文转载自:https://blog.csdn.net/javali1995/article/details/78496545 一、String  概述:String是redis最基本的类型,最大能存储512MB的数据,String类型是二进制安全的,即可以存储任何数据、比如数字、图片、序列化对...

2019-02-18 16:59:33 220 0

转载 Docker目录挂载

Docker容器启动的时候,如果要挂载宿主机的一个目录,可以用-v参数指定。 譬如我要启动一个centos容器,宿主机的/test目录挂载到容器的/soft目录,可通过以下方式指定: # docker run -it -v /test:/soft centos /bin/bash 这样在容器...

2019-01-28 19:11:30 873 0

原创 docker容器保持运行不退出

nsenter工具进入docker容器 概述 对于运行在后台的docker容器,我们经常需要做的事情是进入到容器中,docker为我们提供了docker exec 、docker attach 命令,并且还提供了nsenter工具,外部工具供我们使用。docker attach存在的问题是:当多个...

2019-01-20 23:21:22 7013 2

原创 Docker容器和主机如何互相拷贝传输文件

语法 docker cp [OPTIONS] CONTAINER:SRC_PATH DEST_PATH|- docker cp [OPTIONS] SRC_PATH|- CONTAINER:DEST_PATH OPTIONS说明: -L :保持源目标中的链接   实例 将主机./RS-Map...

2019-01-18 14:11:26 332 0

转载 源码解读之Pre-train

pre-train是迁移学习的基础,虽然Google已经发布了各种预训练好的模型,而且因为资源消耗巨大,自己再预训练也不现实(在Google Cloud TPU v2 上训练BERT-Base要花费近500刀,耗时达到两周。在GPU上可想而知只会更贵),但是学习bert的预训练方法可以为我们弄懂整...

2019-01-15 11:09:11 373 0

转载 欧式距离、标准化欧式距离、马氏距离、余弦距离

参考地址: https://blog.csdn.net/Kevin_cc98/article/details/73742037  

2018-12-29 16:31:39 394 0

转载 python中pylint使用方法(pylint代码检查)

一、Pylint 是什么 Pylint 是一个 Python 代码分析工具,它分析 Python 代码中的错误,查找不符合代码风格标准和有潜在问题的代码。 Pylint 是一个 Python 工具,除了平常代码分析工具的作用之外,它提供了更多的功能:如检查一行代码的长度,变量名是否符合命名标准,...

2018-11-27 15:22:12 9140 0

转载 git提交时报错:Updates were rejected because the tip of your current branch is behind

本文转载自: https://www.jianshu.com/p/004f47f908c5 出现这样的问题是由于:自己当前版本低于远程仓库版本 有如下几种解决方法: 1.使用强制push的方法:  git push -u origin master -f 这样会使远程修改丢失,一...

2018-11-23 14:28:34 327 0

转载 Phabricator代码审查使用方法(mac版)

本文转载自:https://blog.csdn.net/ibelieveyouwxy/article/details/52958464 Phabricator是一个代码审查管理,Arcanist是Phabricator配套的Code Review工具,需要配合本地git使用。 首先先贴上参考博...

2018-10-31 17:23:44 583 0

转载 python日志TimedRotatingFileHandler

本文转载自: https://blog.csdn.net/t163ang/article/details/38495533 TimedRotatingFileHandler这个模块是满足文件名按时间自动更换的需求,这样就可以保证日志单个文件不会太大。 用法很简单,示例代码: 1 ...

2018-10-15 16:15:57 1487 0

转载 git创建与合并分支

本文转载自: 廖雪峰的官方网站 在版本回退里,你已经知道,每次提交,Git都把它们串成一条时间线,这条时间线就是一个分支。截止到目前,只有一条时间线,在Git里,这个分支叫主分支,即master分支。HEAD严格来说不是指向提交,而是指向master,master才是指向提交的,所以,HEAD指...

2018-09-29 15:16:48 151 0

转载 Linux查找含有某字符串的所有文件

本文转载自: https://www.cnblogs.com/wangkongming/p/4476933.html 如果你想在当前目录下 查找"hello,world!"字符串,可以这样:   grep -rn "hello,world!" *  ...

2018-09-25 15:48:49 533 0

提示
确定要删除当前文章?
取消 删除