自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 解决FFMPEG错误:height not divisible by 2 / width not divisible by 2

解决FFMPEG (libx264)错误:height not divisible by 2 / width not divisible by 2

2022-06-28 00:06:33 5257 1

原创 VSCode Jupyter 断点调试方法(新)

自从vscode出了支持jupyter notebook的功能之后,我就再也没有傻傻的用浏览器开过jupyter(问就是vscode好看)。但一直以来jupyter notebook的一个问题是,只能以单元为单位运行,而不能像单个py文件一样进行逐行或者断点调试,这无疑是不方便的。不过vscode去年的某几次更新解决了这个问题,但是断点调试有点隐蔽,因此记录一下。如下图所示,vscode中的notebook打开后是这样的。可以在左侧添加断点,但是点击左上角的小三角运行时,会发现断点不起作用,仍然会执行完

2022-04-18 00:20:35 8835 7

原创 【论文阅读】Attention Is All You Need

Abstract序列转换任务(如机器翻译)通常使用基于卷积或循环神经网络组成的encoder-decoder模型,当时最好的模型采用attention机制连接encoder和decoder。提出一个简单的Transformer架构,完全依赖于attention机制。实验证明该模型取得良好的性能,并且还有容易并行化(parallelizable)、训练时间短等优点。Introduction在序列建模及转换问题中,通常使用RNN,LSTM等模型。RNN的一个突出问题是由于它的时序特性,训练时无法并行化,

2022-04-16 01:30:58 1016

原创 【论文阅读】Learning Deep Features for Discriminative Localization

Abstract研究了全局平均池化(global average pooling, GAP),分析了它如何仅仅使用图像级标签训练就能使CNN具有出色的定位能力(localization ability)。作者发现,尽管GAP若为一种正则化手段被提出(来自Network in Network),但它其实建立了一种具有定位能力的表示 ,可以显示出CNN在一张图片中关注到的区域。作者仅使用GAP和图像级标签(即仅使用图像标签进行弱监督语义分割),在ILSVRC2014的目标检测任务上取得了37.1%的top-5

2022-04-15 00:27:37 3446

原创 【论文阅读】Video Action Transformer Network

Abstract提出Action Transformer,一种利用Transformer架构聚合视频中进行动作的人的spatiotemopral context feature的动作分类和定位模型。实验表明,通过使用high-resolution, person-specific, class-agnostic queries,模型可以学会追踪视频中的个人,并将个人的动作从其他动作中挑选出来。Introduction动作识别的难点之一是:推断一个人的动作经常需要理解**关注对象(person of

2022-04-14 19:48:38 4167 4

原创 【论文阅读】UntrimmedNets for Weakly Supervised Action Recognition and Detection

Abstract提出 UntrimmedNet ,从Untrimmed视频的视频级标签中直接学习动作识别和检测模型,分为 classification 和 selection 两个模块,可端到端训练。Introduction动作识别通常是基于trimmed video 的全监督学习,而不是较长的untrimmed video。在长视频中标注并剪切动作发生位置费时费力,而untrimmed video在网站上很容易获得。提出两个新问题: weakly supervised action recogn

2022-04-11 15:27:07 3465

原创 【论文阅读】Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

Temporal Segment Networks: Towards Good Practices for Deep Action RecognitionAbstract卷积网络在动作识别领域带来的提升不像图像领域那么大提出TSN,基于长距离时序建模的思想,结合时序稀疏采样(sparse temporal sampling)策略和视频级监督(video-level supervision)进行视频动作识别。Introduction卷积网络在图像分类上取得了巨大的成功,但在视频动作识别上却没有取得相

2022-04-11 01:14:15 3251

原创 用于Github Actions的cron表达式规则

触发工作流程的事件 - GitHub Docs

2022-04-01 15:57:11 777

原创 解决EasyOCR报错:cv2.error: Unknown C++ exception from OpenCV code

​使用easyocr读取网络验证码时,遇到报错:cv2.error: Unknown C++ exception from OpenCV code但是奇怪的是不是每次都会报错,有时可以正确读取并识别,有时无法读取并报错。对应的代码是这样的:img_code = Image.open(BytesIO(self.session.get(self.url_code).content))img_code.show()reader = easyocr.Reader(['en'], gpu=False)

2022-04-01 05:24:51 5997 6

原创 Selenium取消控制台输出、忽略报警

Selenium、Pytorch、EasyOCR取消控制台输出、忽略报警

2021-11-20 01:50:54 5158 2

转载 Numpy高级索引

NumPy 高级索引 | 菜鸟教程

2021-11-09 17:57:33 158

转载 Latex caption去除序号显示

【问题描述】用\begin{figure}......\end{figue}会自动在\caption{...}的内容前加上figure1、figure2等,不符合要求。用\renewcommand{\figurename}{}还是会出现“1:”,有没有办法让它什么都不出现,直接用我定义的\caption{...}中的内容。【解决方案】\usepackage{caption}\caption*{the title of figure}即可!...

2021-11-09 15:47:28 4954 1

原创 关于c++中vector的push_back、拷贝构造copy constructor和移动构造move constructor

问题来自C++ Primer的第十三章练习题的13.48.是这样说的:定义一个vector<String>并在其上多次调用push_back运行你的程序,并观察String被拷贝了多少次。其中String是在习题中自己写的一个类似标准库string的类。(第一次看,自己写的String类确实有点挫,于是直接用了github上找到的CppPrimer答案中的String类。...

2018-07-24 17:01:07 5308 1

原创 关于运行时间中的对数

关于运行时间中的对数:书中的翻译是这样的:如果一个算法用常数时间(O(1))将问题的大小削减为其一部分(通常是1/2),那么该算法就是O(logN)。另一方面,如果使用常数时间只是把问题减少一个常数(如将问题减少1),那么这种算法就是O(N)的。翻译很拗口,不过好在下面给出了三个例子:对分查找、欧几里得算法和取幂运算,再结合前面的最大子序列和问题,我的理解是这样的:无论是用循环还是递归,程序每次执...

2018-03-16 19:02:21 655

原创 算法与数据结构——时间复杂度验证:最大子序列问题 Max Subsequence Sum

最近在学数据结构,书看的是《数据结构与算法分析 C语言描述》Mark Allen Weiss的中译本。第二章中的最大子序列和问题:给定整数A1,A2,......AN(可能有负数),求∑(k=i~j)     Ak的最大值(为方便起见,如果所有整数均为负数,则最大子序列和为0)。看到问题后我自己先写了一个笨笨的算法(想了好久啊- - 跟书上的例程相比无论哪方面高下立判啊)。。。时间复杂度是O(N2...

2018-03-10 23:00:03 940

原创 C Primer Plus 第十五章——位操作

使用codeblocks下载时自带的gcc编译以下程序段(自己写的,跟书上不一样,但结果正确)时,debug和release的结果不一样(release结果正确,debug出现错误),debug模式下添加watch中num赋值后不知为何被置为0,调试时发现num在函数调用中出现not available in current context.#include<stdio.h>#defi...

2018-02-23 01:29:42 350 1

原创 C Primer Plus 第十四章——结构和其他数据形式

注意:指向结构的指针、指向结构数组的指针的区别(实际上没用到后者)ptr[i].assign     (ptr+i)->assignread_file()  write_file()指向函数的指针(用(*pt)代替函数名)的数组  float (*p[F])(float x, float y) = {add, subtract,multiply,divide} ;expected decla...

2018-02-11 00:07:23 233

原创 C Primer Plus 第十三章——文件输入/输出

最后有点难!痛苦的经验:fopen()文件打开的模式一定要选对!编程练习的第12题输出乱码找了一个小时没找到bug,突然恍然大悟发现读写模式的w用错了应该用w+!  = =

2018-02-06 00:06:26 405

原创 C Primer plus 第十二章——存储类、链接和内存管理

打字太占时间,改用思维导图 o(* ̄︶ ̄*)o

2018-02-04 22:45:37 340

原创 C Primer Plus 第十一章——字符串和字符串函数

字符串(character string)是以空字符(\0)为结尾的char数组。字符串常量,又称字符串文字,是指位于一对双引号中的任何字符。双引号里的字符加上编译器自动提供的结束表示\0字符,作为一个字符串被存储在内存里。字符串常量属于静态存储(static storage)类。静态存储是指如果在一个函数中使用字符串常量,即使是多次调用了这个函数,该字符串在程序的整个运行过程中只存储一份。整个引

2018-01-27 00:46:24 392

原创 C Primer Plus 第十章——数组和指针

与普通变量相似,在初始化之前数组元素的数值是不定的。编译器使用的数值是存储单元中已有的数值。初始化数组元素时(int),当数值数目少于数组元素数目时(部分初始化),多余的数组元素被初始化为0。如果初始化列表中项目的个数大于数组大小,编译器则会认为这是一个错误。可以在初始化时使用空的方括号来让编译器根据列表中的数值数目确定数组大小。C99增加了一种新特性:指定初始化项目。此特性允许选择对某些元素

2018-01-26 01:14:47 737

原创 C Primer Plus 第九章——函数

函数(function)是用于完成特定任务的程序代码的自包含单元。为什么使用函数?第一,函数的使用可以省去重复代码的编写。如果程序中需要多次使用某种特定功能,那么只需编写一个合适的函数即可。第二,即使某种功能在程序中只使用一次,将其以函数的形式实现也是有必要的,因为函数使得程序更加模块化。在使用函数之前,需要使用ANSI原型声明该函数。在函数原型中可以根据喜好省略(形参)变量名:voi

2018-01-22 23:56:29 296

原创 C Primer Plus 第八章——字符输入/输出和输入确认

示例——一个简单的回显程序:/*echo.c---重复输入*/#includeint main(void){char ch;while((ch=getchar())!='#')putchar(ch);return 0;}       程序运行后,在回显输入之前必须键入完整的一行。这种延迟回显时缓冲(buffered)输入的实例,这种情况下您所键入的字符被手机并存储在一个被称为缓

2018-01-22 16:07:12 967

原创 C Primer Plus 第七章——C控制语句:分支和跳转

专门面向字符I/O而设计的一对C函数: getchar()和putchar():getchar()函数没有参数,它返回来自输入设备的下一个字符。putchar()函数打印它的参数。这两个函数通常在stdio.h中定义。典型的C风格表达式:while((ch=getchar())!='\n') //将两个动作合并为一个表达式。注意!=优先级比=高,因此需要加括号。ANSI C中

2018-01-21 13:29:57 393

原创 C Primer Plus 第六章——C控制语句:循环

while(scanf("%ld",&num)==1){ /* loop actions */}同时使用scanf的两种用法。C语言真值:非0为真,0为假。_Bool:C99新增的布尔类型。一个_Bool类型变量的值只可能为0或1。通常为_Bool变量取一个表明变量真或假的名字以提高可读性。如果包含头文件bool.h则可以用bool代替_Bool,用true和false代替1和0

2018-01-19 21:34:05 260

原创 C Primer Plus 第五章——运算符、表达式和语句

符号=被称为赋值运算符(assignment operator) 。赋值运算符的动作是从右到左(结合性从右到左)。”数据对象“(data object)是泛指数据存储区的术语,数据存储区能用于保存值。例如,用于保存变量或数组的数据存储区是一个数据对象。C的术语左值(lvalue)指用于标识一个特定的数据对象的名字或表达式。例如,变量的名字是一个左值。所以对象指的是实际的数据存储,但是左值是用于

2018-01-19 15:11:45 237

原创 C Primer Plus 第四章——字符串和格式化输入/输出

C没有为字符串定义专门的变量类型,而是把它存储在char数组中。数组的最后一个位置显示字符\0,即空字符(null character),C用它来标记字符串的结束。空字符不是数字0;它是非打印字符,其ASCII码的值为0。该字符的存在意味着数组的单元数必须至少要比存储的字符数多1。用%s来打印一个字符串。scanf()开始读取输入以后,会在遇到的第一个空白字符空格(blank)、制表符(tab

2018-01-17 15:09:32 275

原创 C Primer Plus 第三章——数据和C

/*rhodium.c——用金属铑衡量您的体重#includeint main(void){float weight;float value;printf("Are you worth your weight in rhodium?\n"):printf("Let's check it out.\n");printf("Please enter your weight in pou

2018-01-16 21:57:14 589

原创 C Primer Plus 第二章——C语言概述

// first.c——第一个C程序#includeint main(void){int num;num=1;printf("I am a simple ");printf("computer.\");printf("My favorite number is %d because it is first.\n",num);return 0;}该语句的作用相当于

2018-01-16 19:14:40 251

原创 C Primer Plus 第一章——概览

贝尔实验室的Dennis Ritchie 在1972年开发了C。编译器:将高级语言程序解释成计算机所需的详细机器语言指令集的程序。可以为每种特定的机器语言匹配正确的编译器,就可以将同一高级语言程序转换为各种不同的机器语言程序。使用C语言的7个步骤:1,定义程序目标 2,设计程序3,编写代码4,编译5,运行程序6,测试和调试程序7,维护和修改程序源代码文件:以.c结尾。C编程的基本策

2018-01-16 17:57:22 358

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除