ilove_Moretz-CSDN博客

原创 hugging face model hub 下载预训练模型下载加速

https://mirrors.tuna.tsinghua.edu.cn/help/hugging-face-models/

2021-01-19 14:14:28 646

原创南开大学校园邮箱pop3地址

正文本学期当助教，邮箱收作业，好几百封邮件，手动下载附件太累了，就适用python编写一个自动下载附件的程序。python下载邮箱附件需要邮箱的pop3地址。经过一番尝试和查找，终于找到了南开校园邮箱的pop3地址：“pop3.mail.nankai.edu.cn”。愉快的写代码下载邮箱附件。python下载附件代码我使用的代码参考了这篇博客 https://www.cnblogs.com/chouxianyu/p/11270101.html...

2021-01-13 09:31:28 7952

原创剑指offer：4.二维数组中的查找

1、题目描述在一个二维数组中（每个一维数组的长度相同），每一行都按照从左到右递增的顺序排序，每一列都按照从上到下递增的顺序排序。请完成一个函数，输入这样的一个二维数组和一个整数，判断数组中是否含有该整数。题目提交网址2、思路这道题的数据是有顺序的，因此使用用二分查找的思路来做。二维数组其实就是一个矩阵，我们命名为矩阵AAA。查找的起始位置是数组的右上角AijA_{ij}Aij，起始的i = 0,j =n，n为每个一维数组的长度。输入的数字为target，当AijA_{ij}Aij小于tar

2021-01-11 11:13:46 179

原创论文阅读笔记：Multi-Label Image Recognition with Graph Convolutional Networks

0、简介论文题目：Multi-Label Image Recognition with Graph Convolutional Networks下载链接：https://openaccess.thecvf.com/content_CVPR_2019/papers/Chen_Multi-Label_Image_Recognition_With_Graph_Convolutional_Networks_CVPR_2019_paper.pdf会议：CVPR20191、motivation本文的任务是

2021-01-10 19:20:24 526 1

原创剑指offer：10.斐波那契数列及相关题目

1、题目描述2、解题思路斐波那锲数列的思想很简单f(n)f(n)f(n)的值由f(n−1)f(n-1)f(n−1)和f(n−2)f(n-2)f(n−2)求和得到。初始的f(0)=0f(0)=0f(0)=0，f(1)=1f(1)=1f(1)=1。这道题可以使用递归的方法，但是递归的方法会有很多无效的计算。...

2021-01-04 11:09:56 164 1

原创论文阅读笔记：Deep Extreme Multi-label Learning

0、简介论文名字：Deep Extreme Multi-label Learning下载地址：https://dl.acm.org/doi/abs/10.1145/3206025.3206030会议：ICMR 20181、motivation本文的任务是极限多标签分类（XML），XML和普通的多标签分类的区别是XML的标签量巨大。本文使用度量学习（deep metric learning）的方法学习输入x的embedding，使用图表示学习的方法学习label的embedding，然后使用基于

2020-12-30 21:02:24 867 2

原创论文阅读笔记：BERT for Joint Intent Classification and Slot Filling

0、简介论文名字：BERT for Joint Intent Classification and Slot Filling下载地址：https://arxiv.org/abs/1902.10909会议：无1、motivation这是一篇比较早的论文，在Bert刚出来不久，本文使用Bert来实现natural language understanding中的intent classification和slot filing任务2、模型（1） Slot Filling首先介绍一下什么是sl

2020-12-30 20:55:48 665

原创论文阅读笔记：Label-aware Document Representation via Hybrid Attention for Extreme Multi-Label Text

0、简介论文名字：Label-aware Document Representation via Hybrid Attention for Extreme Multi-Label Text Classification下载地址：https://arxiv.org/abs/1905.10070会议：无1、motivation本文的任务是文本的多标签分类。之前关于文本多标签分类的工作大多集中于学习文本和label 的content，忽略了label 之间的结构信息。本文通过学习labe

2020-12-30 20:43:06 573

原创论文阅读笔记：Label-Specific Document Representation for Multi-Label Text Classification

0、简介论文名字：Label-Specific Document Representation for Multi-Label Text Classification论文链接：https://www.aclweb.org/anthology/D19-1044.pdf会议：ACL20191、motivation本文的任务是文本多标签分类任务，在文本多标签分类任务中，一个待分类的文档会有多个标签，因此一篇文档的整体语义信息是由多个部分组成的。本文引入标签信息，使用注意力机制捕获文档和不同标签之间的

2020-12-30 20:18:23 1334

原创论文阅读笔记：Tracking State Changes in Procedural Text: A Challenge Dataset and Models for Process Paragra

0、简介论文名字：Tracking State Changes in Procedural Text A Challenge Dataset and Models for Process Paragraph Comprehension下载地址：https://arxiv.org/pdf/1805.06975.pdf会议：ACL 20181、论文的motivationMRC是近年来NLP领域比较热门的问题。在MRC中，追踪过程式文本中实体的状态是一个很重要的工作，识别实体在不同步骤中的状态可以更

2020-12-20 20:34:11 244

原创论文阅读笔记：Learning from Task Descriptions

0、简介论文名字：Learning from Task Descriptions下载地址：https://www.aclweb.org/anthology/2020.emnlp-main.105/会议：ACL 20201、论文的motivation机器学习的任务大都是从训练样本中学习样本的分布，然后用学习到的分布在测试集上进行预测。本文提出一种框架从任务描述中进行学习，并构建了ZEST数据集，该数据集能用于从任务描述中学习的任务。在读这篇论文之前，单纯的看标题，感觉是一篇不可思议的工作，

2020-11-30 10:33:29 401

原创 pytorch中函数tensor.numpy()的数据类型

今天写代码的时候，要统计一下标签数据里出现的类别总数和要分类的分类数是不是一致的。我的做法是把tensor类型的数据转变成list，然后用Counter函数做统计。代码如下：from collections import CounterList_counter = Counter(List1)#List1就是待统计的数据，是一维的列表。生成的List_counter是一个字典，键是数据，#对应的值是数据出现的频率在做这个统计的时候，突然发现，我的数据是float的类型，这是不应该出现的，因为标签

2020-11-29 09:14:49 1127

原创 [kuangbin带你飞]专题十二基础DP1 I - 最少拦截系统 HDU - 1257

题目描述某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统.但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能超过前一发的高度.某天,雷达捕捉到敌国的导弹来袭.由于该系统还在试用阶段,所以只有一套系统,因此有可能不能拦截所有的导弹.怎么办呢?多搞几套系统呗!你说说倒蛮容易,成本呢?成本是个大问题啊.所以俺就到这里来求救了,请帮助计算一下最少需要多少套拦截系统.Input输入若干组数据.每组数据包括:导弹总个数(正整数),导弹依此飞来的高度(雷达给出的高

2020-11-19 22:19:01 159

原创论文阅读笔记：LINE: Large-scale Information Network Embedding

0、简介论文名字：LINE: Large-scale Information Network Embedding下载地址：http://www.findshine.com/me/downloads/papers/WWW2015_LINE.pdf会议：WWW 20151、论文的motivation目前已有的节点表示方法很多不能在大规模的图上应用，并且大多数现有方法在做节点表示的时候只关注一阶相似度。因此本文提出Line模型，该模型可以在超大型网络上实现节点表示，并且同时学习了节点的一阶相似度和二

2020-11-17 20:27:31 645 1

原创论文阅读笔记：Random Walk Graph Neural Networks（NIPS2020）

0、简介论文名字：Random Walk Graph Neural Networks下载地址：https://www.lix.polytechnique.fr/~nikolentzos/files/rw_gnns_neurips20会议：NIPS20201、论文的motivation图神经网络可以学习图的特征，从而进行图分类的任务。目前，主流的图神经网络算法都是MPNN的结构。这种结构的图神经网络可以很好的学习节点的特征信息，但是却忽略的图的结构信息。为了利用学习图的结构信息，这篇文章提出了基

2020-11-04 11:07:49 1841 2

原创 [kuangbin带你飞]专题十二基础DP1 H - Tickets HDU - 1260

题目描述 Jesus, what a great movie! Thousands of people are rushing to the cinema. However, this is really a tuff time for Joe who sells the film tickets. He is wandering when could he go back home as early as possible.A good approach, reducing the total tim

2020-10-27 21:23:39 156

原创 [kuangbin带你飞]专题十二基础DP1 G - 免费馅饼 HDU - 1176

题目描述都说天上不会掉馅饼，但有一天gameboy正走在回家的小径上，忽然天上掉下大把大把的馅饼。说来gameboy的人品实在是太好了，这馅饼别处都不掉，就掉落在他身旁的10米范围内。馅饼如果掉在了地上当然就不能吃了，所gameboy>马上卸下身上的背包去接。但由于小径两侧都不能站人，所以他只能在小径上接。由于gameboy平时老呆在房间里玩游戏，虽然在游戏中是个身手敏捷的高手，但在现实中运动神经特别迟钝，每秒种只有在移动不超过一米的范围内接住坠落的馅饼。现在给这条小径如图标上坐标：为了使问题

2020-10-22 10:38:05 143

原创 [kuangbin带你飞]专题十二基础DP1 F - Piggy-Bank HDU - 1114【完全背包】

题目描述Before ACM can do anything, a budget must be prepared and the necessary financial support obtained. The main income for this action comes from Irreversibly Bound Money (IBM). The idea behind is simple. Whenever some ACM member has any small money, he

2020-10-16 22:10:42 187

原创 01背包中二维数组和一维数组的写法

开门见山01背包问题有两种写法，一种是开二维数组记录状态，一种是只开一维数组记录状态。二维数组： for(i = 1;i<n;i++) { for(j = m;j>=1;j--) { if((j-value[i])>=0) { dp[i][j] = max(dp[i-1][j],dp[i-1][j-w[i]]+value[i]); } else dp[i][j] = dp[i-1][j]; } }第二

2020-10-16 11:29:49 192

原创 [kuangbin带你飞]专题十二基础DP1 D - Doing Homework HDU - 1074

题目描述 Ignatius has just come back school from the 30th ACM/ICPC. Now he has a lot of homework to do. Every teacher gives him a deadline of handing in the homework. If Ignatius hands in the homework after the deadline, the teacher will reduce his score of t

2020-10-05 21:57:57 2030

原创对抗训练随笔【持续更新】

什么是对抗训练对抗训练首先出现在图像领域。一张图片，添加一些扰动后，人眼看过去，图像是没有变化的，但是图像分来器会错误识别图像的类别。所以这里就有了对抗样本的概念，能欺骗模型的样本被称为对抗样本。在很多文章中，这个扰动被认为是微小扰动，但我觉得微小扰动是个很狭隘的概念里得出来的结论。因为早期对抗训练的研究都集中于图像领域，向图像中加入小的扰动才能让人类察觉不出来图像有变化。如果脱离图像的领域，或者我们以一个更广的视角看这个问题，就会觉得微小的扰动这个概念有些狭隘。对抗训练的本质是要让模型将人类可以分类正确

2020-09-29 11:28:03 179

原创 [kuangbin带你飞]专题十二基础DP1 C - Monkey and Banana HDU - 1069

题目描述A group of researchers are designing an experiment to test the IQ of a monkey. They will hang a banana at the roof of a building, and at the mean time, provide the monkey with some blocks. If the monkey is clever enough, it shall be able to reach the

2020-09-22 00:26:36 146

原创 [kuangbin带你飞]专题十二基础DP1 B - Ignatius and the Princess IV HDU - 1029

题目描述"OK, you are not too bad, em... But you can never pass the next test." feng5166 says."I will tell you an odd number N, and then N integers. There will be a special integer among them, you have to tell me which integer is the special one after I tell

2020-09-21 00:08:57 191

原创 [kuangbin带你飞]专题十二基础DP1 A - Max Sum Plus Plus HDU - 1024

题目描述Now I think you have got an AC in Ignatius.L's "Max Sum" problem. To be a brave ACMer, we always challenge ourselves to more difficult problems. Now you are faced with a more difficult problem.Given a consecutive number sequence S1, S2, S3, S4 ... S

2020-09-19 20:48:09 202

原创 [kuangbin带你飞]专题一简单搜索 H - Pots POJ - 3414

题目描述You are given two pots, having the volume of A and B liters respectively. The following operations can be performed: FILL(i) fill the pot i (1 ≤ i ≤ 2) from the tap; DROP(i) empty the pot i to the drain; POUR(i,j) pour from

2020-09-02 09:44:06 163

原创 [kuangbin带你飞]专题一简单搜索F - Prime Path POJ - 3126

题目描述The ministers of the cabinet were quite upset by the message from the Chief of Security stating that they would all have to change the four-digit room numbers on their offices.— It is a matter of security to change such things every now and then, to

2020-08-03 09:37:34 187

原创 [kuangbin带你飞]专题一简单搜索POJ-1426

题目描述iven a positive integer n, write a program to find out a nonzero multiple m of n whose decimal representation contains only the digits 0 and 1. You may assume that n is not greater than 200 and there is a corresponding m containing no more than 100 de

2020-07-27 22:54:31 136

原创 [kuangbin带你飞]专题一简单搜索 D - Fliptile POJ - 3279

题目描述Farmer John knows that an intellectually satisfied cow is a happy cow who will give more milk. He has arranged a brainy activity for cows in which they manipulate an M × N grid (1 ≤ M ≤ 15; 1 ≤ N ≤ 15) of square tiles, each of which is colored black o

2020-07-20 11:18:40 183

原创 [kuangbin带你飞]专题一简单搜索 POJ-3278

题目描述Farmer John has been informed of the location of a fugitive cow and wants to catch her immediately. He starts at a point N (0 ≤ N ≤ 100,000) on a number line and the cow is at a point K (0 ≤ K ≤ 100,000) on the same number line. Farmer John has two mo

2020-07-05 09:18:24 154

原创 [kuangbin带你飞]专题一简单搜索 B - Dungeon Master

题目You are trapped in a 3D dungeon and need to find the quickest way out! The dungeon is composed of unit cubes which may or may not be filled with rock. It takes one minute to move one unit north, south, east, west, up or down. You cannot move diagonally

2020-06-29 21:45:26 163

原创八皇后问题--判断是否是在同一斜线上

八皇后问题是经典的搜索问题，其他文章已经有了很多详细的介绍，本文就不再介绍。本文主要讨论的内容是如何判断是否两个点在同以直线上。假设一个点AAA的坐标是[a,b][a,b][a,b]，那么和该点在同一斜线上的点A′A^{'}A′有四种,分别是[a+x,b+x]、[a−x,b−x]、[a+x,b−x]、[a−x,b+x][a+x,b+x]、[a-x,b-x]、[a+x,b-x]、[a-x,b+x][a+x,b+x]、[a−x,b−x]、[a+x,b−x]、[a−x,b+x]。前两种点横纵坐标相减和A点横

2020-06-22 19:29:39 2857 2

原创 [kuangbin带你飞]专题一简单搜索

题目描述在一个给定形状的棋盘（形状可能是不规则的）上面摆放棋子，棋子没有区别。要求摆放时任意的两个棋子不能放在棋盘中的同一行或者同一列，请编程求解对于给定形状和大小的棋盘，摆放k个棋子的所有可行的摆放方案C。Input输入含有多组测试数据。每组数据的第一行是两个正整数，n k，用一个空格隔开，表示了将在一个n*n的矩阵内描述棋盘，以及摆放棋子的数目。 n <= 8 , k <= n当为-1 -1时表示输入结束。随后的n行描述了棋盘的形状：每行有n个字符，其中 # 表示棋盘区域， .

2020-06-22 19:13:48 156

原创 C++ 中scanf的返回值

引言今天开一个新坑，ACM中的C++基础。因为写oj题的时候，好多C++的基础知识都忘记了。这里写博客来记录一下学习到的基础知识点。scanf函数的返回值scanf函数是一个输入函数，用法如下所示scanf("%d%d",&a，&b);将输入的数据分别赋予到a和b。当赋值成功，返回一个数字，这个数字就是赋值成功的个数。比如说a、b都赋值成功了，就返回2。两个都没赋值成功，返回值是0。当输入是“f”和“1”，返回值是0，也就是说，当第一个赋值出现错误，就直接返回0了，不会进行后面的

2020-06-11 22:04:30 1368

原创为什么ASR的输入要使用频谱特征

语音数据的raw data 一般是波形数据，波形数据画出图来后，纵轴是信号的幅度，横轴是时间。波形图是声音信号采样来的，采样点一般会比较多。比如用16kHZ采样，那么每秒就会有16000个数据点，这个输数量太大了。因此转换为频谱，数据量会少。但是这个说法我觉得不靠谱。一段20s录音，采样点是1600020 = 320,000。将这段录音用stft进行变换，得到161个窗口，每个窗口的维度是2501，总的数据量是1612501=402,661，这个数据量不比原始的小。还有一种说法是对于同一个字，同一个人用不

2020-06-10 19:41:12 334

原创什么是end-to-end的模型

端到端的模型目前很流行，那么什么是端到端的模型呢，有没有一个很比较明确的解释？在[1]中，作者是这样说的。The entire model is trained jointly, from scratch, by optimizing the probability of the output sequence using a chain rule decomposition. We call this an end-to-end model because all the components of

2020-06-10 17:56:36 2403 1

原创【LeetCode】108. 将有序数组转换为二叉搜索树

引言从今天开始刷LeetCode，笨鸟先飞啦。LeetCode和一般IO还不太一样，一开始没搞懂如何输入，怎么就一个类的输入地方，没有头文件，没有主函数。网上搜了一下才知道，LeetCode已经把这些东西都给你写好了，你只需要写核心算法部分就可以了。我已经不记得上次写C++代码是什么时候了，一直写Python代码，导致现在C++的语法规则都忘记了很多，尤其是结尾的分号老是忘记加，结构体定义的一些知识也忘记的差不多了。后面要加强C++的这些基础知识了。题目描述原文链接：https://leetcode

2020-06-08 22:21:27 149

原创关于CTC的自我总结

引言今天组会又被老板教训了，原因是觉得我研究问题一直浮于表面，他看不到我对研究内容的推动。组会结束后，做了一下自我反思。这一周我大部分时间都在实验室，虽然会在座位上玩手机摸鱼，但是起码有一半的时间是在学习，一周下来不应该像老板说的那样毫无进展呀。我总结了两点原因，1、我的摸鱼时间可能有点多，学习时间可能还是不够。2、我没有认真做好总结，在组会的时候没能把学到的东西展现出来。对于第二点，我最近觉也越来越觉得自己缺乏展示自己成果的能力。事儿可能做了不少，但是没能展示出来，让别人知道，那就相当于白做。不只局限于

2020-06-07 20:36:47 1397

原创 pytorch中出现nan的现象的一个奇怪的原因

引言写代码过程中遇到的一个小坑，陆陆续续的调了好久，今天解决了，特此记录一下。正文前段时间跑了一个TextCnn的demo，但是一直出现nan的情况。排查了好久发现是全连接层后产生了nan，一个比较奇怪的现象。使用nn.Linear函数实现全连接，把相同的输入数据和全连接层参数取出来后用numpy的dot函数计算，发现结果不是nan，也就是说不是数据的问题，是计算的过程中出现了问题。检查的时候发现模型和数据都没有用to.(‘cuda’)放到gpu上训练，所以猜想会不会是gpu训练和cpu训练的问题。用

2020-06-06 09:45:53 7161 3

原创科研是如何产生的——attention机制motivation

在传统的Seq2Seq模型中，encoder和decoder一般采用LSTM。decoder使用encoder最后一个隐藏状态和前一时刻的输出来进行本时刻的解码，这就导致每一时刻解码使用的序列隐藏信息是相同的，这本身是一件不合理的事情。为了解决这一不合理的点，attention机制就被提了出来。decoder每次解码的时候不是使用最后一个隐藏状态了，而是对所有隐藏状态进行加权求和，也就是雨露均沾一下，每一个隐藏状态都会用到，至于使用多少，那就是由其对应的权重决定，这个权重是可训练了量，具体的细节就不在本文中

2020-06-04 16:06:05 215

原创什么是streaming ASR？

最近刚刚入坑ASR，在调研论文的时候看到一种类型叫做streaing ASR，有很多论文在streaming ASR上做文章。那么什么是streaming ASR 呢？我在一篇论文的摘要中找到了这么一段话：In this work, we propose a transformer based end-to-end ASR system for streaming ASR, where an output must be generated shortly after each spoken word[

2020-05-23 17:48:43 853

空空如也

空空如也