- 博客(139)
- 资源 (23)
- 收藏
- 关注
原创 【编程题】【未知出处】二叉树的重构
给定二叉树的两种遍历方式,我们可以很容易的重构二叉树这篇文章的图解很清楚https://blog.csdn.net/sun_lm/article/details/82888980现在的题目是:只给定前序遍历,如何重构二叉树,例如给定124xxx3xx,X表示Noneclass Node(): def __init__(self, value, left=None,...
2019-07-27 11:34:37
208
原创 【编程题】【未知出处】数组段的完全覆盖
题目:单个线段[2,6]可称为完全覆盖[4,6],现有两组线段,判断A组能否完全覆盖B组例如: [[1, 3], [2, 6]] [[1, 4], [4, 5]] True [[1, 2], [4, 7]] [[2, 5], [6, 7]] False相关题目:【leetcode56:合并区间】方法一:...
2019-07-25 22:47:04
548
1
原创 【编程题】【牛客网】二进制中1的个数
剑指offer15题由于除法效率比移位运算慢得多,所以本文使用移位运算符>>代替除以2的操作。一、整数与1做与运算,每次右移二、整数与flag做与运算,flag每次左移三、整数与(整数-1)做与运算,直至与运算结果为0一、该方法可以很好的处理正数,但在处理负数时,右移操作之后需要将首位置一,这样会导致最后生成0xFFFFFFFF,陷入死循环,所以推荐方法...
2019-07-22 10:57:10
171
原创 【编程题】【leetcode145】打印二叉树(非递归)
递归法打印二叉树是极其简单的而非递归的方式呢?要求非递归的实现二叉树的打印时,要用到栈来实现迭代一、先序:根左右;二、中序:左根右;三、后序:左右根;一、先序:根左右:入栈顺序为右左-出栈时每pop一个,就把他的右左入栈 1 # 先序打印二叉树(非递归)2 def preOrderTravese(node):3stack = [node]...
2019-07-22 10:22:43
347
原创 Python heapq(堆操作)
函数:heappush(heap, item):将 item 元素加入堆。 heappop(heap):将堆中最小元素弹出。 heapify(heap):将堆属性应用到列表上。 heapreplace(heap, x):将堆中最小元素弹出,并将元素x 入堆。 merge(*iterables, key=None, reverse=False):将多个有序的堆合并成一个大的有序堆,然后再...
2019-07-15 08:51:54
566
原创 【ERROR】关于训练时以及开发集上loss丝毫不变的原因
记录一次马虎导致的BUG事情起因:最新在跑项目的代码,一切都好好的,直到我突发奇想加了个新model之后,一切诡异了起来。。。代码逻辑是每训练一轮会在开发集上测三次,然后log打印每次测出的loss以及PRF指标,在改了model之后,在每一次打印的log中所有的数值都丝毫没有变化。。。出现问题:训练时以及开发集上loss丝毫不变这说明了虽然模型每一轮都在训练,...
2019-07-13 20:28:20
2869
3
原创 【RuntimeError】Gather got an input of invalid size【DataParallel问题】
错误:错误发生在DataParallelordata_parallel()时RuntimeError: Gather got an input of invalid size: got [32, 7, 15013], but expected [32, 6, 15013] (gather at /pytorch/torch/csrc/cuda/comm.cpp:239出错位置...
2019-07-13 15:34:53
3053
原创 【论文笔记】【ACL2019】Searching for Effective Neural Extractive Summarization: What Works and What’s Next
一、论文题目:Searching for Effective Neural Extractive Summarization: What Works and What’s Next论文地址:https://arxiv.org/abs/1907.03491源代码:https://github.com/fastnlp/fastNLP作者单位:Ming Zhong∗, Pengf...
2019-07-11 16:33:16
908
原创 【code】多GPU多卡并行如何操作
最初以为多卡并行仅仅只是一句把模型model以及optimize放在nn.DataParallel上就可以完成:import torch.nn as nn【1.返回模型】self.bert_model = nn.DataParallel(self.bert_model, device_ids=args.gpu_ids, output_device=torch.cuda.current...
2019-06-16 16:53:07
3483
原创 【RuntimeError】the derivative for 'target' is not implemented
报错信息:Traceback (most recent call last): File "/users/anaconda3/lib/python3.6/site-packages/torch/nn/modules/module.py", line 489, in __call__ result = self.forward(*input, **kwargs) File "/...
2019-05-27 22:19:52
13066
3
原创 使用哈尔滨工业大学SCIR的开源代码训练自己的ELMo
本篇博客使用哈尔滨工业大学SCIR实验室的ELMoForManyLangs链接:https://github.com/HIT-SCIR/ELMoForManyLangs使用方法:1. gitclone 到本地2. 在Downloads处(提供了各种语言(包括简体中文)下载预训练好的语言模型,下载的语言模型中带有自己的config。3. 执行setup命令python se...
2019-05-26 15:05:20
3129
1
原创 scatter_add()函数
Pytorch 的 Tensor 用法官方解释:https://pytorch.org/docs/stable/tensors.html?highlight=scatter_add#torch.Tensor.scatter_add_函数参数:scatter_add_(dim, indexTensor, otherTensor)→ 输出Tensor函数用法:selfTensor.s...
2019-05-12 16:53:31
6807
翻译 next(self.parameters()).new_zeros()是什么
Q:next(self.parameters())是什么?Q:next(self.parameters()).new_zeros()是什么?Q:next(self.parameters()).data是什么?Q:next(self.parameters()).data.new(batch_size, self.nhid).zero_()是什么?A:1. 使用:某类的某一函...
2019-04-17 14:11:40
5713
原创 Pytorch如何进行参数初始化
一、所有的torch官方的初始化方法:官网:https://pytorch.org/docs/stable/search.html?q=torch.nn.init.&check_keywords=yes&area=default中文译本:https://blog.csdn.net/HowardWood/article/details/79508925torch.nn.i...
2019-04-17 14:06:06
10559
1
原创 NLP常用loss总结
1. nn.CrossEntropyLoss()适用于多分类问题(词表上的多分类等)输入 - input x, (N,C)(N,C)(N, C), C=num_classes 类别总数.输入 - target y, (N)(N)(N), 每个值都是 0 ≤ targets[i] ≤ C−12. nn.BCELoss()输入 - input x, (N, *), 0或1...
2019-04-10 13:47:34
3933
原创 pool.imap_unordered()多进程模块使用
很简单的使用代码:from multiprocess import Poolpool = Pool(args.n_cpus)# eg: f_list = [a, b, c]for a in pool.imap_unordered(f, f_list): # Some unrelated codepool.close()pool.join()def f(a): ...
2019-04-05 21:33:06
14123
原创 Pytorch版本的BERT使用学习笔记
一、Google BERT:BERT地址:https://github.com/google-research/bertpytorch版本的BERT:https://github.com/huggingface/pytorch-pretrained-BERT使用要求:Python 3.5+&PyTorch0.4.1/1.0.0 & pip installp...
2019-03-23 16:12:20
70806
25
原创 【error】unzip解压中文压缩包出现乱码
运行命令:unzip '*.zip'(为了解压目录下全部文件)出现问题:unzip解压中文安装包出现乱码问题原因:在window下创建的中文文件默认gbk编码,而MAC则是utf-8编码。解决方式:unzip -O GBK xxx.zip参考博客:https://blog.csdn.net/gatieme/article/details/44807105unzip的参数...
2019-03-10 17:23:57
831
原创 数据增强与数据扩充
数据扩充方法在图像上很常用:方法有:左右翻转、随机裁剪、旋转、平移、噪声扰动、亮度对比度变换等许多简单高效的方法;其作用是增大数据集且提高泛化效果,随手百度都有很多讲解。在文本上的使用:方法有:同义词替换(这种方法比较大的局限性在于同义词在NLP中通常具有比较相近的词向量,因此对于模型来说,并没有起到比较好的对数据增强的作用)反向翻译(这是机器翻译中一种非常常用的增强数...
2019-02-26 15:06:02
6170
原创 机器学习面试问题
2019.2.17.Sunday.为了面试.百度查了一些机器学习面试问题,在此对不会的知识点做一下记录。一、优化方法https://www.tuicool.com/articles/EfInM3Q1. 梯度下降法(随机梯度下降法SGD、批量梯度下降法)BGD---最小化所有训练样本的损失函数,使最终求解的是全局的最优解,对于大规模样本问题效率低下。SGD---最小化每条样...
2019-02-22 21:52:32
236
原创 python中的numel()函数
numel()函数:返回数组中元素的个数使用例子:params = sum(p.numel() for p in list(net.parameters())) / 1e6 # numel()print('#Params: %.1fM' % (params))net.parameters():是Pytorch用法,用来返回net网络中的参数params:用来返回net网络中的参...
2019-02-03 15:44:16
61612
3
原创 NLP领域的CNN如何操作?
NLP领域的一种CNN操作是:对于输入的句子x做卷积,代码举例如下:x = [conv(x.permute(0,2,1)) for conv in self.convs] # 1x = [F.max_pool1d(i, i.size(2)).squeeze(2) for i in x] # 2x = torch.cat(x,1) ...
2019-01-27 16:41:55
596
原创 pipenv的使用
1)安装:pip install pipenv2)查看用法:pipenvUsage: pipenv [OPTIONS] COMMAND [ARGS]...Options: --where Output project home information. --venv Output virtualenv information. ...
2019-01-21 11:27:43
418
原创 使用Pointer Network做抽取式摘要
记录一下Pointer Network 相关博客及学习过程,主要记录学习如何使用Pointer Network做抽取式摘要一、参考博客https://www.jianshu.com/p/2ad389e91467 详细讲解了一份tf代码https://blog.csdn.net/qq_20135597/article/details/83586694 翻译了这篇论文的前半部分http...
2019-01-19 14:10:00
2345
原创 深度学习中随机种子的初始化
1. gpu:torch.cuda.manual_seed(args.seed)2. cpu:torch.manual_seed(args.seed)3. random:random.seed(args.seed)4. numpy:numpy.random.seed(args.seed)同时进行
2018-12-19 21:04:04
4460
原创 【error】ImportError: cannot import name 'rnn_cell'
报错信息:【error】ImportError: cannot import name 'rnn_cell' 出错句:from tensorflow.python.ops import rnn_cell 检查过程:>>>import tensorflow as tf>>>tf.__version__得到本机版本为'1.0.1' ...
2018-12-06 15:36:36
5044
原创 Unsupervised Abstractive Meeting Summarization...论文笔记
1. 论文信息Unsupervised Abstractive Meeting Summarization with Multi-Sentence Compression and Budgeted Submodular MaximizationACL 20182. 相关工作(本文使用到了以下工作内容)•Multi-Sentence CompressionGraph (MSCG) ...
2018-11-29 16:38:40
990
3
原创 句子的检错/纠错
一、句子的检错纠错,如下四种方法:1、检错部分:1.1. 序列标注:本来的序列标注是进行命名实体识别的任务,在检错任务中将其改成01标注,使用O标注正确的词,使用S-1标注错误的词。数据处理:保证了错误的句子占全部句子的25%; sent: right_sent:342803; wrong_sent:101565;(3:1)vocab_num:102674;word: ri...
2018-11-22 17:10:40
1804
原创 re.sub()和re.match()
w = 'lllcooooc'1.>>> p = re.compile( r'c(.+)c' )>>> re.sub(p,'',w)'lll'>>> matchObj = re.match( p, line)None3.>>> p = re.compile( r'(.+)c(.+)c' )&...
2018-11-21 20:42:21
596
原创 【概念】端口转发和端口映射
以下为整理各个相关网址所得(仅有概念,不含配置方法)1.端口转发:可以新建监听地址和端口予以指定,而端口映射:只能一对一。2.端口映射:比如你发布了一个网站(假设你买了公网ip和域名),http方式访问,但是想了下觉得不好,在路由器上把80端口映射成8080,别人访问时候就加上端口8080,流量过路由器再转成80送到服务器。端口转发:类似代理服务器,把收到数据包转发到目的服务器...
2018-11-02 20:55:14
1838
1
转载 哈工大【LTP】
哈工大【LTP】LTPLTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的中文语言处理模块,以及基于动态链接库(Dynamic Link Library, DLL)的应用程序接口、可视化工具,并且能够以网络服务(Web Service)的形式进行使用。(LTP-server)开源代码:https://github.com/HIT-SCIR/ltp在线文档...
2018-10-27 16:17:23
736
原创 django的使用注意事项
1. django的安装http://www.runoob.com/django/django-install.html2. django创建第一个项目(数据与视图混合在一起)2.1. 建立项目之后,修改 urls.py 文件;新建一个 view.py 文件;修改setting文件把其中的ALLOWED_HOSTS=[]改成ALLOWED_HOSTS=['*'] ##* 表示任意地址...
2018-10-25 12:54:22
242
转载 汉字转拼音(同音异形)-工具
1. 在线工具:http://www.txttool.com/WenBen_ChineseToPinYin.asp2. python工具包:汉字转拼音:from pypinyin import ...https://ctolib.com/mozillazg-python-pinyin.html拼音转汉字:from Pinyin2Hanzi import...https://...
2018-09-25 22:10:30
2226
原创 NCRF序列标注开源工具使用
github地址:https://github.com/jiesutd/NCRFpp一、网页翻译NCRF++: An Open-source Neural Sequence Labeling ToolkitNCRF++:一个开源的神经序列标注工具包Sequence labeling模型在许多NLP任务中都很流行,如命名实体识别(NER)、词性标注(POS)和分词。最先进的序列标注模...
2018-09-25 11:13:40
7711
16
转载 什么是Faster-R-CNN(Fast R-CNN与R-CNN)
提出这一概念的论文:《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》Faster-R-CNN是CV-Object detection领域下的。(目标检测=多图像识别+多物体定位)CV-Object detection的相关学习可以参考https://zhuanlan.zhihu....
2018-09-17 19:23:20
4291
原创 Curriculum Learning
从一篇论文学习“课程学习”,着重关注Curriculum Learning,在此简单记录相关内容。 论文题目:Curriculum Learning for Natural Answer Generation(中科院自动化所)论文地址:https://www.ijcai.org/proceedings/2018/0587.pdf 一、简介参考链接:https://www.soh...
2018-09-05 22:29:32
4149
原创 IU X-Ray 数据集
1)数据集来源:https://iuhealth.org/find-medical-services/x-rays(IU,The Indiana University Health,不直接提供数据集)数据集简介:The Indiana University Chest XRay Collection (IU X-Ray) is a set of chest x-ray images pai...
2018-08-27 14:47:01
7614
2
原创 image saliency detection 是什么
image saliency detection 译为 图像显著性检测什么是显著性检测(saliency detection):====什么是显著性(Statistical significance):别称:统计显著性。总的来说,它表示群体之间得以相互区别的能力。显著性的含义是指两个群体的态度之间的任何差异是由于系统因素而不是偶然因素的影响。我们假定控制了可能影响两个群体之间...
2018-08-07 10:55:19
4142
原创 MURA数据集--医疗影像--斯坦福
几个链接:=====stanford ML group 官网 https://stanfordmlgroup.github.io/ 【里面有很多数据集(MURA用于骨x射线异常检测、Countdown Regression、CheXNet胸部x光诊断放射性肺炎、Palliative Care缓和医疗资源、Education检测书写错误并提供反馈、Arrhythmia心电图信号检测心律失...
2018-08-06 21:10:27
7039
2
原创 【error】RuntimeError: cuda runtime error (59) : device-side assert triggered at /pytorch/torch/lib/TH
报错:RuntimeError: cuda runtime error (59) : device-side assert triggered at /pytorch/torch/lib/THC/generic/THCTensorCopy.c:70错误反馈:/pytorch/torch/lib/THC/THCTensorIndex.cu:279: void indexSelectSmallInde...
2018-07-12 19:31:57
12681
4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅