自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 元学习

从零开始,了解元学习【机器之心】 https://www.jiqizhixin.com/articles/meta-learning-intro 针对实验“元学习”的方法有很多,具体可以分为以下几类: https://blog.csdn.net/qq_34886403/article/det...

2020-06-11 15:02:26 44 0

原创 一文学会Pytorch版本BERT使用

前言: coder们最常用的Pytorch版本的BERT应该就是这一份了吧https://github.com/huggingface/pytorch-pretrained-BERT 这份是刚出BERT的时候出的,暂且叫它旧版 我在学习使用旧版的时候粗略的记过一些笔记:https://blo...

2020-02-24 21:31:02 1711 0

原创 open-nmt参数max_generator_batches

本文关于onmt的一个参数: 【max_generator_batches】 该参数被设置为默认32: (下图为在onmt开源代码的opt.py参数文件中的默认设置) help文档意为: max_generator_batches为一个序列中并行运行生成器的最大的单词数量。越高越快,...

2020-02-12 17:23:50 268 0

原创 三种rouge测评方法

1. 坑爹的rouge安装 2. rouge4chinese(不用安装,拿来直接用,中文) https://github.com/hpzhao/nlp-metrics/tree/master/ROUGE4Chinese 3. sumeval(安装很简单,安完直接用,英文) https://...

2020-01-30 18:20:39 585 1

原创 torchtext.data 的 Field, RawField

今天试图更改open-nmt代码时,在preprocess阶段发现一处代码: fields = inputters.get_fields( opt.data_type, src_nfeats, tgt_nfeats, d...

2020-01-07 17:02:34 792 0

原创 面经 | NLP算法岗(作业帮)

这是我面的第一家公司,也是拿到的第一个offer 师兄和面试官都给我留下很深刻的印象 (悄悄:得知公司业务很强,利润很大 面试体验 a. 作业帮的提前批面试时间相对较早,今年是在7/8月份 b.面试内容更侧重编程和逻辑题,项目没有问的非常深入 c.面试体验很好,面试官都很nice,...

2020-01-06 15:43:27 180 0

原创 Open-NMT 使用笔记

官网:https://opennmt.net 是什么:是一个开源NMT工具 OpenNMTis an open source ecosystem for neural machine translation and neural sequence learning. 来源:由哈佛NLP组推出...

2019-12-23 10:27:40 739 0

原创 `pip install -e .` vs`python setup.py install`

https://www.jb51.cc/python/241778.html

2019-12-20 17:04:42 155 0

原创 对话摘要 | 抽取式与生成式 | 数据集与baseline

背景:由于CVAE在summary_yxu的代码和讯飞的自己提取出来的对话数据集上,初见成效,于是这次用在一些官方的数据集上和一些对话摘要的baseline上试一下,万一效果也好呢? NOTE:再次提醒自己这次一定要用心,用心! 一、文本摘要与对话摘要数据集对比 文本摘要 全文没有...

2019-12-18 22:05:30 525 3

原创 tensorflow dataset到底有哪些数据集

首先来看一下,tensorflow dataset都集成了哪些数据集 >>> import tensorflow_datasets as tfds >>> print(tfds.list_builders()) ['bair_robot_pushi...

2019-12-12 18:00:55 310 0

原创 一次GAN项目背景下的tensorflow_datasets中mnist数据集的下载笔记

起因:帮我可爱的妹子跑一个GAN的代码(已有,github),这回是在我自己实验室的服务器上(到了展现我男友力的时候了!激动!) 我的背景:第一次 | 正式使用tensorflow | 要开始排坑了 | 我爱Pytorch | 用之前碎碎念 项目地址:https://github.com/go...

2019-12-12 17:36:52 342 0

原创 【ERROR】TypeError: expected bytes, Descriptor found

起因: 帮我可爱的妹子在windows电脑上,尝试跑通一个tensorflow的GAN代码 报错信息: TypeError: expected bytes, Descriptor found 出错位置: Traceback (most recent call last): ...

2019-12-06 16:55:49 10906 18

原创 GitHub使用笔记

Github是什么:这个星球上最流行的开源托管服务 如何建立自己的GitHub仓库? 1. 打开官网,并注册自己的帐号(官网:https://github.com/) 2. new一个新仓库 此时你的电脑已经复制了这段信息 3. 在保证你的电脑已经安装了git的情况下...

2019-12-03 09:13:34 31 0

原创 【ERROR】AttributeError: 'BatchNorm2d' object has no attribute 'track_running_stats'

起因: 一份很久之前(2018年)的项目代码image caption,今天想重新运行模型测试文件,却出现了如下错误 报错信息: AttributeError: 'BatchNorm2d' object has no attribute 'track_run...

2019-12-01 22:51:54 160 0

原创 apex 安装/使用 记录

一、apex 是什么:混合精度 什么用:提升GPU上的训练速度 GitHub:https://github.com/NVIDIA/apex API文档:https://nvidia.github.io/apex 使用要求: Python 3 CUDA 9 or newer PyT...

2019-11-27 15:20:38 5107 3

原创 【ERROR】AssertionError: The NVIDIA driver on your system is too old (found version). Please upd

错误信息: AssertionError: The NVIDIA driver on your system is too old (found version 10000). Please update your GPU driver by downloading and installin...

2019-11-13 15:26:45 1275 2

原创 【error】旧版本的torchtext会出现的问题

出错代码: torch.save(vocab_en, opt.vocab_path) 或pickle.dump(dict(vocab_en), open(opt.vocab_path,'wb')) 都会报pickle的错误 其中 from torchtext i...

2019-11-10 15:28:59 265 0

原创 面经 | NLP算法岗(腾讯)

​今年腾讯大部分hc留给提前批和实习转正,建议尽早准备。 提前批投递时可以自主选择部门,有些部门的hc几乎全都留给实习生转正,建议无法实习的童鞋们,提前做好调研,避开这些部门。 部门选错了就直接凉了哦(手动微笑脸) 体验总结 a.面试内容很全面,会涉及相关领域的前沿工作,并且会问的相当...

2019-11-06 21:36:00 1256 4

原创 【error】 RuntimeError: Expected object of scalar type Byte but got scalar type Int for sequence elmen

错误: RuntimeError: Expected object of scalar type Byte but got scalar type Int for sequence elment 1 in sequence argument at position #1 'tensors...

2019-10-24 20:45:31 350 0

原创 Paper | NAACL2019 抽取式摘要之 SUMO

论文题目:Single Document Summarization as Tree Induction 论文作者:Yang Liu, Ivan Titov and Mirella Lapata. 下载链接:https://www.aclweb.org/anthology/N19-1173.p...

2019-10-20 20:28:37 364 0

原创 面经 | 记录秋招遇到的概率题与智力题(附答案)

概率题与智力题对于秋招选手是一种怎么样的存在? 概率论是计算机科学非常重要的基础学科之一,智力题是概率题的另一种形式,概率题也是在程序员求职过程中经常遇到的问题。下面稍作整理,供大家参考。 Q:49个人中至少几个人生日是同一月? A:5 Q:一个聚会上,每两个人只握一次手,一共...

2019-10-12 19:56:47 196 0

原创 【论文】【ACL2018】Neural Document Summarization by Jointly Learning to Score and Select Sentences

论文题目:Neural Document Summarization by Jointly Learning to Score and Select Sentences. 论文作者:Qingyu Zhou, Nan Yang, Furu Wei, Shaohan Huang, Ming Zhou...

2019-10-07 16:19:20 398 0

原创 【编程题】腾讯2017秋招技术类笔试题

四道编程题,120min,python实现, 第一题 假定一种编码的编码范围是a ~ y的25个字母,从1位到4位的编码,如果我们把该编码按字典序排序,形成一个数组如下: a, aa, aaa, aaaa, aaab, aaac, … …, b, ba, baa, baaa, baab, ba...

2019-08-31 17:22:55 84 0

原创 【编程题】【2019字节跳动技术类笔试】

一、并查集 题目:豆油瓶是直系和间接朋友组成的群体,也可以自成一个豆油瓶,输入用户之间的互动次数矩阵,大于等于3即为是朋友,求豆油瓶的个数 思路:初始化每个用户的父节点为自己,nn遍历每个用户对ab,如果是朋友且父节点不同,则把a的最上父节点的父节点更新为b的最上父节点,使他们拥有相同的最上父...

2019-08-26 10:16:52 183 0

原创 【编程题】【未知出处】01矩阵里找面积最大的全1矩阵

相似题目:01矩阵里找面积最大的全1方矩阵 解法:动态规划 if num[i][j] == 0: dp[i][j] = 0 else: dp[i][j] = max(dp[i-1][j],dp[i-1][j-1],dp[i-1][j-1]) + 1 本题:01矩阵里找面...

2019-08-20 16:16:16 807 0

原创 【编程题】【leetcode】股票问题 - 学一套走天下

知识点:数组操作 类似题目: 901 股票价格跨度 3 31.4% 中等 121 买卖股票的最佳时机 46 50.4% 简单 122 买卖股票的最佳时机 II 43 55.0% 简单 123 买卖股票的最佳时机 III 17 39.0% ...

2019-08-18 17:29:39 222 0

原创 【编程题】【2019腾讯技术类第一次笔试】

一、前缀和/快慢指针,暴力法会超时 快慢指针:快指针先走k个 然后走一遍 O(n) 走的时候保存最小值 就是答案 二、回溯/BFS 解题思路: 在只走‘.’的情况下把终点的冰踩碎 输入n*m的矩阵,以及走的开始和终点位置 在开始点,上下左右找‘.’,有就走,并把改点设置为‘X’...

2019-08-18 11:13:03 611 0

原创 【编程题】杨氏矩阵

题目: 给定n×n的实数矩阵,每行和每列都是递增的,求这n^2个数的中位数。 方法一:与求第K小的数相同的方法,维护一个大小为K的大顶堆 O(nlogK) 方法二:http://zhiqiang.org/cs/median-algorithm-of-ordered-matrix.html ...

2019-08-17 21:05:07 40 0

原创 【编程题】【leetcode28】KMP

【难度:easy】 【时间复杂度:O(m + n)】 class Solution(object): def strStr(self, haystack, needle): """ :type haystack: str ...

2019-08-17 20:23:34 54 0

原创 【编程题】【未知出处】输入两个日期计算两个日期相差的天数

【难度:easy】 # 输入为 # y1 # y2 # m1 # m2 # d1 # d2 days1 = [31,29,31,30,31,30,31,31,30,31,30,31] days2 = [31,28,31,30,31,30,31,31,30,31,30,31] def cou...

2019-08-16 15:05:35 765 0

原创 【书籍记录】《编程之法》

这本书记录了一些算法岗面试常见的编程题 因为博主本人记忆力较差,因此将书中比较好的部分或面试过程中真实遇到过的题目再此标记一下 直接使用目录形式进行重点标记 1.字符串 1.3.全排列:回溯递归(时间O(n!)空间O(n!)) 1.5.回文判断:双指针(时间O(n)空间O(1))...

2019-08-06 10:22:34 62 0

原创 【编程题】【leetcode】排列组合 - 学一套走天下

知识点:全排列以及各种要求的排列组合 类似题目: 39.组合总和 40. 组合总和 II 46. 全排列 47. 全排列 II 78. 子集 90. 子集 II 以leetcode90为例,python 题目:给定一个可能包含重复元素的整数数组 nums,返回该数组所有...

2019-08-05 13:15:38 102 0

原创 【编程题】【未知出处】字典序

字典序一般会出两种题目: 一、给一个字典序排列的数组,查找第k个元素 leetocde440:https://leetcode-cn.com/problems/k-th-smallest-in-lexicographical-order/submissions/ 输入n: 13,k: 2...

2019-08-04 22:57:24 45 0

原创 【编程题】【未知出处】任务排序 / 拓扑排序

知识点:拓扑排序 一、只要求满足偏序的拓扑排序 输入:几个偏序 n=5 # 节点个数 m=4 # 偏序个数 12 23 13 15 输出:一种排序方式或不能排序 1 4 2 5 3 思路:存储输入的拓扑关系,定义数组记录每一个点状态。对状态显示还未被遍历的点进行DFS(),遍历该点...

2019-08-04 17:22:02 60 0

原创 【编程题】【未知出处】克隆排队

题目来自于https://blog.csdn.net/song2016/article/details/81187109 以下记录想法与python核心代码 题目1: Alice、Bob、Cathy、Dave四个人排队喝可乐,喝完一个人变两个,接着继续到队尾排队,问第N个人喝可乐的人是谁...

2019-07-28 11:52:10 27 0

原创 【编程题】【未知出处】二叉树的重构

给定二叉树的两种遍历方式,我们可以很容易的重构二叉树 这篇文章的图解很清楚https://blog.csdn.net/sun_lm/article/details/82888980 现在的题目是: 只给定前序遍历,如何重构二叉树,例如给定124xxx3xx,X表示None class...

2019-07-27 11:34:37 63 0

原创 【编程题】【未知出处】数组段的完全覆盖

题目: 单个线段[2,6]可称为完全覆盖[4,6],现有两组线段,判断A组能否完全覆盖B组 例如: [[1, 3], [2, 6]] [[1, 4], [4, 5]] True [[1, 2], [4, 7]] [[2, 5], [6, 7]] False ...

2019-07-25 22:47:04 125 1

原创 【编程题】【牛客网】二进制中1的个数

剑指offer15题 由于除法效率比移位运算慢得多,所以本文使用移位运算符>>代替除以2的操作。 一、整数与1做与运算,每次右移 二、整数与flag做与运算,flag每次左移 三、整数与(整数-1)做与运算,直至与运算结果为0 一、该方法可以很好的处理正数,但在处理负...

2019-07-22 10:57:10 41 0

原创 【编程题】【leetcode145】打印二叉树(非递归)

递归法打印二叉树是极其简单的 而非递归的方式呢? 要求非递归的实现二叉树的打印时,要用到栈来实现迭代 一、先序:根左右; 二、中序:左根右; 三、后序:左右根; 一、先序:根左右:入栈顺序为右左-出栈时每pop一个,就把他的右左入栈 1 # 先序打印二叉树(非递归) 2 ...

2019-07-22 10:22:43 130 0

原创 Python heapq(堆操作)

函数: heappush(heap, item):将 item 元素加入堆。 heappop(heap):将堆中最小元素弹出。 heapify(heap):将堆属性应用到列表上。 heapreplace(heap, x):将堆中最小元素弹出,并将元素x 入堆。 merge(*iterab...

2019-07-15 08:51:54 121 0

提示
确定要删除当前文章?
取消 删除