LiuLllDDdd-CSDN博客

原创 opencv-python计算最小外接矩形minAreaRect

需求描述最近遇到一个需求，通过minAreaRect得到最小外接矩阵后，还需要判断该矩形中的文字是横向排列还是纵向排列。网上查找很多教程，他们对minAreaRect函数以及其返回值的解释与我在实际操作时的结果都不一样，不知道是由于版本差异还是我操作的问题。我使用的版本是opencv-python 4.5.3.要想判断矩形中的文字方向，首先要知道矩形四个点的坐标以及旋转角度。新版的opencv的改动就在于四个点坐标以及旋转角度的定义。例如，原来minAreaRect函数返回的旋转角度在[-90, 0)之

2021-11-17 12:50:54 10283

原创集装箱号识别项目

集装箱号识别项目项目地址：集装箱识别项目该项目基于 mmOCR 0.2.0主分支目前支持 PyTorch 1.5 以上的版本。文本检测算法PANet (ICCV’2019)文字识别算法RobustScanner (ECCV’2020)使用教程构建数据集检查集装箱号标记数据增强切下文本区域构建识别数据集python tools/data/create_dataset.py构建文本检测数据集python tools/data/textdet/icdar_conv

2021-08-11 11:56:30 1807 11

原创 Dynamic Relevance Learning for Few-Shot Object Detection Readme

Dynamic Relevance Learning for Few-Shot Object Detection(arXiv) PyTorch implementation of paper “Dynamic Relevance Learning for Few-Shot Object Detection”[PDF]Tabel of ContentsInstallationData PreparationGetting StartedInstallationCode built o

2021-08-09 12:38:15 543

转载 ubuntu安装mysql5.7

搬运收藏ubuntu安装mysql5.7

2021-07-27 17:39:37 171

原创 NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver

原因一电脑内核版本更新，导致上个版本安装的驱动在这个版本无法使用。解决方法一：退回上个内核版本在开机进入grub2界面时，选择ubuntu高级选项，选择上个版本的内核。解决方法二：使用动态内核适配dkmll /usr/src/ # 查看当前驱动版本 nvidia-470.57.02/sudo apt-get install dkmssudo dkms install -m nvidia -v 470.57.02（470.57.02表示的是驱动版本号）原因二电脑bios开启secur

2021-07-23 17:19:46 168

原创 FSOD代码结构

数据加载Pascal VOC 2007+2012数据集划分

2021-07-01 12:37:11 615

原创 Pytorch实现CapsuleNet

这里不讨论capsule的设计原理、优势以及特点等信息，只关注Capsule Net是如何实现的。总体流程在（28，28）的图片上进行卷积操作，得到feature map（20，20，256）concat 8个卷积得到的feature map,将其作为capsule（2048，8）使用转移矩阵W将每个8维的capsule转换为10个16维的高级capsule（2048，10，16），再加权求和这2048个高级capsule得到DigitCaps（10，16），使用动态路由算法调整W.将长度作为

2020-12-25 01:25:22 1244 6

原创 FSOD with Attention-RPN and Multi-Relation 推理过程

测试过程在少样本目标检测任务中，训练过程每次输入的是一个episode，也就是有一张query image需要检测对象，以及20张support images提供类别信息。在support images中，一共有2个类别，一个类别10张图片。在训练时会确保一个类和query image相同，一个类别和它不同。训练时模型的任务就是找到query image中属于support images类别的对象，然而在测试的时候每张图片需要和20个类别的support features做对比。总体流程如下：每个类

2020-12-09 15:06:12 627

原创 Faster-Rcnn给Proposals分配标签

Faster-Rcnn检测框架主要分为两个部分，第一部分是Region Proposal Network(RPN)以及第二部分对Proposals进行分类和回归。本文主要回顾RPN在图片上产生约2000个Proposals后，如何根据ground-truth选取其中的256个，并为每个proposal分配标签参与第二阶段的训练。大致流程如下：计算每个ground-truth与所有proposals的交并比IOU，为每个proposal找到与其匹配最好的ground-truthIOU大于0.7作为正

2020-12-07 00:28:10 1223

原创 PyTorch读取目标检测数据集

数据集介绍一般的目标检测数据集由两部分组成，图片images和标签annotations。由少样本目标检测数据集FSOD为例。FSOD数据集组成图片部分就不多介绍了，重点来看一下标记部分annotation，对于图片的标记数据一般用json格式保存。上面的图片是FSOD测试集的标记数据，以字典的形式保存，Keys分别为:images: Values是一个列表，长度即测试集图片的数量。列表中的每个元素对应一个图片的数据, 例如id, file_name, width, heighttype:

2020-07-21 11:25:14 4135

原创目标检测anchor

anchor的概念最早是在Faster R-CNN中提出来的。我们都知道两阶段检测网络中第一个重要的步骤就是生成Proposals（候选区域），Faster R-CNN首次使用卷积网络来进行proposals的获取，这个网络称之为Region Proposal Networks（RPN）。当我们通过基础网络（Resnet，VGG等）获得feature map后，在上面进行卷积操作（如33），每个...

2020-04-01 10:37:49 393

原创力扣LeetCode刷题8 机器人大冒险

力扣团队买了一个可编程机器人，机器人初始位置在原点(0, 0)。小伙伴事先给机器人输入一串指令command，机器人就会无限循环这条指令的步骤进行移动。指令有两种：U: 向y轴正方向移动一格R: 向x轴正方向移动一格。不幸的是，在 xy 平面上还有一些障碍物，他们的坐标用obstacles表示。机器人一旦碰到障碍物就会被损毁。给定终点坐标(x, y)，返回机器人能否完好地到达终点。如果能，...

2020-01-18 12:11:16 508

原创力扣LeetCode刷题7 分式化简

有一个同学在学习分式。他需要将一个连分数化成最简分数，你能帮助他吗？连分数是形如上图的分式。在本题中，所有系数都是大于等于0的整数。输入的cont代表连分数的系数（cont[0]代表上图的a0，以此类推）。返回一个长度为2的数组[n, m]，使得连分数的值等于n / m，且n, m最大公约数为1。示例 1：输入：cont = [3, 2, 0, 2]输出：[13, 4]解释：原连分数...

2020-01-15 10:57:16 351

原创 ResNet论文阅读

问题背景卷积神经网络在图像分类中有非常好的效果，原因在于可以通过多个卷积层提取图像不同程度的特征，并且可以通过网络层数的堆叠使得网络可以提取更多不同程度的图像特征，以便获得更好的分类效果。那么我们是否可以不断地通过堆叠网络层数来获得更好的效果呢？显然我们必须还得面对网络层数增加之后梯度消失的问题。我们可能会想到这样一种情况，随着网络深度的增加，准确率会逐渐达到饱和然后迅速下降，我们称这种现...

2020-01-04 13:45:38 380

原创动态规划之最大草药价值

Description小K是个苦命的孩子，他的师傅为了多赚钱，以减肥为理由，让他去采药，并说不完成不能吃饭。野地里有许多不同的草药，采每一株都需要一些时间，每一株也有它自身的价值。要求在规定的时间t里，采到的草药的总价值最大。Input第一行有2个整数T(1≤T≤1000)和M(1≤M≤100)，一个空格隔开，T代表总共能够用来采药的时间，M代表山洞里的草药的数目接下来的M行每行包括两个在...

2019-12-23 17:00:38 1204 1

原创动态规划之最长非递减子序列

Description在一个数字序列中，找到一个最长的非连续子序列，使得这个子序列是不下降（非递减）。现有序列A={1,2,3,-1,-2,7,9},则A的最长不下降子序列是{1,2,3,7,9}。如果有多个最长序列，只需选数字顺位靠后的序列从大到小输出。Input输入2行；第一行一个整数n，表示有n个整数的序列要输入，n<1000;第二行共有n个整数。Output输出最长的...

2019-12-23 16:27:58 1844

原创动态规划之切钢条

Description一家公司购买长钢条，将其切割成短钢条出售，切割本身没有成本，长度为i的短钢条的价格为Pi。那给定一段长度为n的钢条和一个价格表Pi,求钢条的切割方案使得收益Rn最大。Input输入钢条的长度n。Output输出获得的最大收益。Sample Input7Sample Output18解题思路：动态规划对于长度为n的钢条，我们可以先切一刀，切下长度为1-...

2019-12-23 14:49:50 989 2

原创动态规划之双11的红包雨

Description双11到了，据说这2天会下红包雨，每个红包有不同的价值，小k好开心，但有个规则，就只能接掉落在他身旁的10米范围内的红包（0-10这11个位置）。小k想尽可能的多抢红包，这样就可以去买一个华为手机，小k每秒种只能在移动不超过一米的范围内接住红包。小k一开始站在5这个位置，因此在第一秒，他只能接到4,5,6这三个位置中其中一个位置上的红包。问小k最多可能接到多少价值的红包？...

2019-12-23 14:34:47 1270

原创分治之棋盘覆盖

Description在一个2k×2k 个方格组成的棋盘中，恰有一个方格与其他方格不同，称该方格为一特殊方格，且称该棋盘为一特殊棋盘。在棋盘覆盖问题中，要用图示的4种不同形态的L型骨牌覆盖给定的特殊棋盘上除特殊方格以外的所有方格，且任何2个L型骨牌不得重叠覆盖。Input输入一个整数k，k<=5；输入特殊格子的坐标x，y。Output输出一个由数值表示的二维矩阵。填充规则如下：...

2019-12-22 22:01:01 326

原创递归之找路径总数

Description一个N×N的街区，左上角为[1,1],右下角为[N,N]，（N<100）。现要求出从左上角到右下角的路径总数，每次只能向下或向右走。路径中有M个街区有障碍（M<10），不能通过，但不会形成到不了终点的情况。每条路上的汇总路径数都要对10000取余，以免数据溢出。Input第一行：两个整数N和M；分别表示街区维度和障碍数；第二行开始M行：障碍所在的街区。...

2019-12-21 13:53:17 947

原创递归之涂格子

Description有排成一行的n个方格，用红、粉、绿三色涂每个格子，要求：（1）任何相邻的方格不能同色；（2）且首尾两格也不同色。求n个格子满足要求的涂法数。Input输入多个整数n，每个整数表示有多少个方格，n<=60Output输出多个整数，一行一个，表示每个对应输入的涂法数Sample Input56Sample Output3066算法思想只有一...

2019-12-21 13:29:27 1322

原创递归之找数字

Description给定一组无序数值，数值的大小在1到百万之间，数值的个数在10-50万个之间。现需要找出其中第5到第10小的整数。Input一组非0整数，（个数>=10个），0为结束标志。Output其中第5到第10小的整数。每输出一个整数换行。Sample Input123456789100Sample Output5678910算法思...

2019-12-20 23:15:21 796

原创贪心算法之最少区域覆盖

Description给出n个区间的起点和终点，求最少使用其中多少个区间可以将所有区间所在的区域完全覆盖。（测试的数据确保这1点）。Input第1行一个整数n，表示n个区间；第2行开始n行，每行2个整数，表示一个区间范围。Output按区间先后顺序，输出选中的区间。Sample Input71 51 63 61 76 99 107 9Sample Output1 ...

2019-12-18 19:14:30 2711

原创贪心算法之最少跳跃次数

Description给定一个非负整数数组，假定你的初始位置为数组第一个位置。数组中的每个元素代表你在那个位置能够跳跃的最大长度。你的目标是到达最后一个下标位置，并且使用最少的跳跃次数。Input输入一组非负整数数组，数组长度不超过500。Output最少经过几次跳跃，可以到达最后一个位置。Sample Input2 3 1 1 4Sample Output2算法思想每次都遍...

2019-12-18 18:04:14 2450

原创贪心算法之最少体力消耗

Description小K没事干，他要搬砖头，为了达到较好的减肥效果，教练规定的方式很特别：每一次，小K可以把两堆砖头合并到一起，消耗的体力等于两堆砖头的重量之和。经过 n-1次合并后，就只剩下一堆了。小K在搬砖头时总共消耗的体力等于每次合并所耗体力之和。小K为了偷懒，希望耗费的体力最小。例如有 3堆砖头，数目依次为 1、2、9 。可以先将 1 、 2 堆合并，新堆数目为3 ，耗费体力为...

2019-12-18 17:41:58 2585

原创搜索之N皇后问题

DescriptionN皇后的排列，每行一个不冲突；N<=13。Input一个数字N (6 <= N <= 13) 表示棋盘是N x N大小的。Output前三行为前三个解，每个解的两个数字之间用一个空格隔开。第四行只有一个数字，表示解的总数。解的输出顺序为从上到下从左到右，小的优先输出Sample Input6Sample Output2 4 6 1 3 5...

2019-12-18 17:21:07 874 2

原创搜索之最大封闭区域

Description有一个由数字 0、1 组成的方阵中，存在一任意形状的封闭区域，封闭区域由数字1 包围构成，每个节点只能走上下左右 4 个方向。现要求只把【最大封闭区域】内的空间填写成2 。例如： 6×6 的方阵：60 1 0 0 0 01 0 1 1 1 10 1 1 0 0 11 1 0 0 0 11 0 0 0 0 11 1 1 1 1 1填写后如下：0 1 0 0...

2019-12-18 17:12:30 2427

原创递归与分治策略

1.阶乘函数// 阶乘函数 int factorial(int x){ if(x == 0) return 1; return x*factorial(x-1);}2.斐波拉契数列// 斐波拉契数列 int fibonacci(int x){ if(x<=1) return 1; return fibonacci(x-1) + fibonacci(x-2);...

2019-11-28 22:53:42 609

原创贪心算法经典问题思路、代码

贪心算法基本思想贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑，它所作出的选择只是在某种意义上的局部最优选择。当然，希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解，但对许多问题它能产生整体最优解。如单源最短路径问题，最小生成树问题等。在一些情况下，即使贪心算法不能得到整体最优解，其最终结果却是最优解的很好近似。局部最优 -&gt...

2019-11-15 16:40:14 1085

原创动态规划

基本思想将待求解的问题分解成若干子问题，先求子问题，然后从子问题的解得到原问题的解。适用于动态规划法求解的问题，经分解得到的子问题往往不是相互独立的。保存已解决子问题的答案，在需要时再找出已求得的答案，这样就可以避免大量的重复计算用一个表来记录所有已解决的子问题的答案，不管该子问题以后是否被用到，只要它被计算过，就将其结果填入表中。步骤找出最优解的性质，并刻画其结构特征递归地定...

2019-11-01 23:00:42 238

原创服装图片分类（tensorflow实现）

from __future__ import absolute_import, division, print_function, unicode_literalsimport tensorflow as tffrom tensorflow import kerasimport numpy as npimport matplotlib.pyplot as pltprint(tf.__ve...

2019-10-29 22:39:00 580

原创分治之第k小的数

Problem ADescription输入n个数，求其中第k小的数。Input第一行包含两个整数n和k；n<1000，1<=K<=n第二行包含n个整数。Output输出第k小的那个整数。Sample Input15 11 3 7 2 4 6 -1 0 9 88 2 5 17 6 1Sample Output-1#include<iostream&...

2019-10-27 18:44:09 756

原创 BP算法实现--minst手写数字数据集识别

实验步骤初始化网络架构网络层数，每层神经元数，连接神经元的突触权重，每个神经元的偏置构造bp算法函数对于一个输入数据，前向计算每层的输出值，保存未激活的输出和激活过的输出值，这里用的激活函数是sigmoid根据最后一层的输出值计算出相应的δ，再依次反向计算对应层的δ。根据得到的δ，可以得到每层的Δw和Δb。更新网络中w , b遍历训练集中的每个训练样本，每个样本通过bp算法所得到...

2019-10-14 12:17:12 4881

原创三、多变量线性回归

上次学习的单变量回归模型是针对一个特征（变量）而言的，在实际情况中一个样本应该有多种特征，还是拿房价举例。这时候房价有多个特征，包括**面积、房间数量、楼层高度、房龄，**最后还有各自对应的价格。注：nnn = 特征的数量x(i)x^{(i)}x(i) = 输入的ithi^{th}ith训练样本xj(i)x_j^{(i)}xj(i) = ithi^{th}ith训练样本的jjj特征值...

2019-09-14 09:53:49 2618

原创力扣LeetCode刷题6 字符串转换整数 (atoi)

请你来实现一个 atoi 函数，使其能将字符串转换成整数。首先，该函数会根据需要丢弃无用的开头空格字符，直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或者负号时，则将该符号与之后面尽可能多的连续数字组合起来，作为该整数的正负号；假如第一个非空字符是数字，则直接将其与之后连续的数字字符组合起来，形成整数。该字符串除了有效的整数部分之后也可能会存在多余的字符，这些字符可以被忽...

2019-09-05 20:08:05 179

原创力扣LeetCode刷题日记（五）整数反转

给出一个 32 位的有符号整数，你需要将这个整数中每位上的数字进行反转。示例 1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储得下 32 位的有符号整数，则其数值范围为 [−231, 231 − 1]。请根据这个假设，如果反转后整数溢出那么就返回 0。来源：力扣（LeetCode）...

2019-08-16 21:20:21 244

原创力扣LeetCode刷题日记（四） Z 字形变换

将一个给定字符串根据给定的行数，以从上往下、从左到右进行 Z 字形排列。比如输入字符串为 “LEETCODEISHIRING” 行数为 3 时，排列如下：L C I RE T O E S I I GE D H N之后，你的输出需要从左往右逐行读取，产生出一个新的字符串，比如：“LCIRETOESIIGEDHN”。请你实现这个将字符串进行指定行数变换的函数：st...

2019-08-16 11:17:40 263

原创 2017cs231n阶段性总结（一）

刚刚开始入门深度学习的过程艰苦异常，没有一点相关的基础甚至于Python都不能熟练掌握。学习cs231n课程的时候眼睛都跟不上字幕，讲的是什么东西也基本听不懂，在这种煎熬的环境下磕磕绊绊了好久才学到Lecture3，给自己做个总结吧。Lecrure1：引言这一节课主要讲两个方面的内容：计算机视觉的发展历史从生物拥有视觉开始讲起，中间经过无数科学家的研究和尝试，使用了各种方式试图让机器能够拥...

2019-08-15 12:50:16 445

原创写文档常用到的LaTeX 各种命令，符号(自用)

分数\frac{2}{4}=0.524=0.5\frac{2}{4}=0.542=0.5\cfrac{2}{c + \cfrac{2}{d + \cfrac{2}{4}}} =a2c+2d+24=a\cfrac{2}{c + \cfrac{2}{d + \cfrac{2}{4}}} =ac+d+4222=a求和\sum_{k=1}^N k^2∑k=1Nk2\sum_{k=1}...

2019-08-14 20:14:37 249

原创力扣LeetCode刷题日记（三）回文串问题

1判断一个整数是否是回文数。回文数是指正序（从左向右）和倒序（从右向左）读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不是一个回文数。进阶:你能...

2019-08-13 16:58:51 336

空空如也

空空如也