自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 近期论文阅读

[AAAI’21]ACSNet:Action-Context Separation Network for Weakly Supervised Temporal Action Localization从图中可以看出,左侧绿色框表示是动作类、红色框表示是动作上下文、蓝色框表示为背景类。通过右图的特征空间可见,蓝色的背景类特征与GT相差较远,但是红色的上下文类与GT高度相似,特别是在边界区域,这就导致上下文的误检。问题的引入:通过视频级别分类定位的前景不仅涉及实际操作实例,还涉及其周围的上下文。以前的方法利

2021-11-03 10:22:34 555 3

原创 近期论文动态

1.弱监督的两大挑战1.1 动作完整性由于缺少帧级标签,若只根据注意力值进行动作定位,没有考虑到相邻帧之间可能存在相关性,可能导致出现信息丢失的问题。例如,对于动作“跳”,包含准备、跳、落地、恢复四个过程,其中准备和恢复过程在动作定位时对于跳的注意力值可能偏低,从而在定位时可能过滤到这两个部分,导致在弱监督动作定位过程中常会出现动作漏检的问题。1.2 上下文信息混淆由于缺少帧级标签,弱监督动作定位常会出现动作和背景混淆的问题,将背景误识别为动作,进而影响动作定位的精确性。2. 基于注意力机制的弱

2021-11-02 21:32:11 408

原创 高维度思考法

1.解决问题的三个领域已知的已知=知道=知道自己知道——问题和答案均已知。这个对应既有的经验和知识。也就是说,已经发生过的事,可以共享、保存以便于以后活用。那也就意味着,这种问题是存在“正确的答案”的。应对的方法是“如何有效、准确、快速地解决问题”。已知的未知=不知道=知道自己不知道——问题已知而答案未知。这个一般指狭义的解决问题。比如,“知道成本低的产品更畅销但不知道该如何实现”产品的开发等,对应的就是这个领域。在这里,“问题已经给出"是大前提。未知的未知=不知道=不知道自己不知道——连问题都不知

2021-06-02 19:37:26 1291

原创 图chuang

2021-05-19 11:05:46 117

原创 爬虫学习

1.WEB的请求过程到底我们浏览器在输⼊完⽹址到我们看到⽹⻚的整体内容, 这个过程中究竟发⽣了些什么?这⾥我们以百度为例. 在访问百度的时候, 浏览器会把这⼀次请求发送到百度的服务器(百度的⼀台电脑), 由服务器接收到这个请求, 然后加载⼀些数据. 返回给浏览器, 再由浏览器进⾏显示. 听起来好像是个废话…但是这⾥蕴含着⼀个极为重要的东⻄在⾥⾯, 注意, 百度的服务器返回给浏览器的不直接是⻚⾯, ⽽是⻚⾯源代码(由html, css, js组成). 由浏览器把⻚⾯源代码进⾏执⾏, 然后把执⾏之后的结果

2021-05-17 10:08:30 116

原创 看板-项目的有效管理

1.敏捷开发敏捷主张简洁、主张信息透明化,期望所有的信息都能通过一个醒目的辐射源影响到团队所有成员,以调动大家的积极性、主动性和自发性。而Scrum和看板则是这样一个可以将信息辐射给大家的工具。2.Scrum2.1 小故事一天,一只鸡散步时遇见了猪。鸡对猪说:“嗨,我们合伙开个餐厅吧。”猪说:“好啊,那准备取什么店名呢?”鸡说:“要不,就叫火腿和鸡蛋吧。”猪直接拒绝了:“那可不行。我要割肉,你只要下蛋。这样下去,我迟早要完蛋。”2.2 Scrum产生的背景这个故事实际上反映了软件开

2021-04-01 19:50:19 732

原创 GAN网络(实验)

3 GAN应用于手写数字识别我使用mnist手写数字来做数据集,通过生成对抗网络我们希望生成一些“以假乱真”的手写字体。为了加快训练过程,不使用卷积网络来做判别器,使用简单的多层网络来进行判别。3.1 定义判别器和生成器Discriminator Networkclass discriminator(nn.Module): def __init__(self): super(discriminator, self).__init__() self.dis

2021-03-02 13:33:20 1311 1

原创 GAN网络(理论)

1.GAN能做什么GAN的初衷就是生成不存在于真实世界的数据,类似于使得 AI具有创造力或者想象力。应用场景如下:AI作家,AI画家等需要创造力的AI体;将模糊图变清晰(去雨,去雾,去抖动,去马赛克等),这需要AI具有所谓的“想象力”,能脑补情节;进行数据增强,根据已有数据生成更多新数据供以feed,可以减缓模型过拟合现象。2.GAN浅析2.1 GAN的基本结构GAN的主要结构包括一个生成器 G(Generator)和一个判别器 D(Discriminator)。例如,我们需要球员在球场

2021-03-01 15:13:54 1608 1

原创 CPM论文笔记

目录0.绪论1.CPM是什么?2.摘要3.本文方法3.1 Pose Machines3.2 Convolutional Pose Machines3.2.1 Keypoint Localization Using Local Image Evidence3.3 Sequential Prediction with Learned Spatial Context Features3.3 Learning in Convolutional Pose Machines0.绪论什么是人体姿态估计?人体.

2020-11-11 21:25:04 2109

原创 HRNet

论文链接:https://arxiv.org/abs/1902.09212代码链接:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch论文源码分析:1 源码准备在指定文件夹下,输入命令:git clone https://github.com/leoxiaobin/deep-high-resolution-net.pytorch.git下载完成后,得到HRNet源码2 源码结构下表列出HRNet中比较重要的文件:.

2020-10-29 15:16:18 2223 5

原创 c3d

train.pyimport timeitfrom datetime import datetimeimport socketimport osimport globimport torchvisionfrom torch.nn.init import constant, normalfrom tqdm import tqdmimport torchfrom tensorboardX import SummaryWriterfrom torch import nn, optim.

2020-09-28 13:18:31 373

原创 C3D论文笔记

论文链接:http://vlg.cs.dartmouth.edu/c3d/c3d_video.pdf代码链接:https://github.com/jfzhang95/pytorch-video-recognition1. C3D是什么?C3D,全称Convolutional 3D,即3D卷积。3D卷积方法是把视频划分成很多固定长度的片段(clip),相比2D卷积,3D卷积可以提取连续帧之间的运动信息,换句话说,3D卷积将视频多帧进行融合。2. 论文贡献3D ConvNets比2D ConvN.

2020-09-21 20:55:23 1238

原创 TSN源码分析

论文链接:https://arxiv.org/abs/1608.00859代码链接:https://github.com/yjxiong/tsn-pytorch1 源码准备在指定文件夹下,输入命令:git clone --recursive https://github.com/yjxiong/tsn-pytorch 下载完成后,得到tsn-pytorch源码。2 源码结构...

2020-09-09 14:36:48 3122 2

原创 TSN实验过程

论文链接:https://arxiv.org/abs/1608.00859代码链接:https://github.com/yjxiong/tsn-pytorch1.数据准备阶段1.1 数据集介绍在视频分类项目中,有很多经典的公开数据集,目前主要的数据集如列表所示:数据集视频数分类数发布年背景KTH60062004静态HMDB516766512011动态UCF101133201012012动态THUMOS-2014183941.

2020-09-08 11:26:45 7860 91

原创 TSN论文笔记

论文链接:https://arxiv.org/abs/1608.00859代码链接:https://github.com/yjxiong/tsn-pytorch1.TSN是什么?TSN,全称为temporal-segment-networks,即时间段网络。该网络是一种新的基于视频的动作识别框架,旨在通过基于分段的采样和聚合模块对长距离的时间结构建模。通过简单的平均池华和多尺度时间窗口的集成,该模型可以很容易地应用于修剪和未修剪视频中的动作识别。2.TSN面临的问题基于视频...

2020-09-05 16:11:43 2217 4

原创 Pycharm 单步调试

Pycharm 单步调试1.添加断点2.调试断点3.打印权重矩阵和偏置值4.源代码1.添加断点断点的添加如下图所示在代码前面左键单击即可2.调试断点点击那个绿色的甲虫图标,进行断点调试。点击调试按钮后,代码运行到第一个断点处点击Step Over 或者按F8,我们继续往下运行,到下一个断点,按钮如下图所示:可以看到,程序运行到新的断点处,并且在上一行代码中,显示W此时的值进行多次调试之后,可以看到许多变量的值,并且在不断的调试之中,动态变化。其中 该代码总共有64个批次,每

2020-07-09 22:09:10 1566

原创 TensorFlow学习(4) 非线性回归

1.核心代码这个程序为简单的三层结构组成:输入层、中间层、输出层import numpy as npimport matplotlib.pyplot as pltimport tensorflow as tf# 使用numpy生成200个随机点# 从-0.5到0.5范围均匀取200个点# np.newaxis增加维度# 最终成为200*1的数据x_data = np.linspace(-0.5, 0.5, 200)[:, np.newaxis]noise = np.random.n

2020-07-08 22:32:21 151

原创 TensorFlow学习(3)拟合线性函数k和b

拟合线性函数k和b代码import os# os.environ["TF_CPP_MIN_LOG_LEVEL"]='1' # 这是默认的显示等级,显示所有信息os.environ["TF_CPP_MIN_LOG_LEVEL"]='2' # 只显示 warning 和 Error# os.environ["TF_CPP_MIN_LOG_LEVEL"]='3' # 只显示 Errorimport tensorflow as tfimport numpy as np# 使用numpy生成

2020-07-08 17:55:07 454

原创 TensorFlow学习(2) 变量

文字目录1.变量(Variable)2.创建及使用变量3.结果展示1.变量(Variable)在TensorFlow中,变量(Variable)是特殊的张量(Tensor),它的值可以是一个任何类型和形状的张量。与其他张量不同,变量存在于单个 session.run 调用的上下文之外,也就是说,变量存储的是持久张量,当训练模型时,用变量来存储和更新参数。除此之外,在调用op之前,所有变量都应被显式地初始化过。2.创建及使用变量import tensorflow as tfx = tf.Vari

2020-07-08 16:22:00 249

原创 TensorFlow学习(1) 创建图 启动图

文章目录1.TensorFlow基本概念2.创建图 启动图3.结果分析1.TensorFlow基本概念使用图(graphs)来表示计算任务在被称之为会话(session)的上下文(context)中执行图 使用tensor表示数据使用变量(Variable)维护状态使用feed和fetch可以为任意的操作赋值或者从其中获取数据TensorFlow是一个编程系统,使用图(graphs)来表示计算任务,图中的节点称之为op(operation),一个op获得0个或多个tensor,执行计算,产生

2020-07-08 13:06:58 205

原创 TensorBoard MNIST 网络结构

1.mnist简介MNIST数据集是深度学习巨头-卷积网络之父Yann LeCun发布的一个供计算机视觉识别学习使用的手写数据识别的数据集。它包括60000个训练集和10000个测试集,每条数据(或者说每张图片)都是28x28x1类型,即图片的宽度为28,高度为28,通道数为1。且MNIST数据集已经把图片数据转换为标准的列表数据类型,如60000个训练集的数据格式是:[60000, 784],表示有60000条数据,每条数据是784维(28x28=784)。我把mnist数据集下载至网盘,方便下载

2020-07-07 20:04:04 467

原创 CS231 线性分类

线性分类k-Nearest Neighbor分类器的不足分类器必须记住所有训练数据并将其存储起来,以便于未来测试数据用于比较。这在存储空间上是低效的,数据集的大小很容易就以GB计。对一个测试图像进行分类需要和所有训练图像作比较,算法计算资源耗费高。评分函数和损失函数评分函数:原始图像数据到类别分值的映射损失函数:用来量化预测分类标签的得分与真实标签之间一致性的从图像到标签分值的参数化映射现在假设有一个包含很多图像的训练集[公式],每个图像都有一个对应的分类标签[公式]。这里[公式]并且[

2020-07-03 22:25:01 132

原创 linux TensorFlow安装

1.安装Anaconda选择Anaconda来安装python集成环境更加简单。Anaconda的下载地址是:https://www.anaconda.com/distribution/Anaconda提供了三种操作系统的安装,此次博客基于ubuntu-18.04.4,且python环境为3.7,所以下载“64-Bit (x86) Installer”将该安装包放置在合适位置,并打开终端,安装python3.7bash ~/Downloads/Anaconda3-5.2.0-Linux-

2020-07-02 20:54:55 503

原创 windows10 TensorFlow安装

Anaconda1.安装Anaconda安装Python的方法很多,我们可以直接在Python的官网下载符合你操作系统的Python安装包,直接安装即可:https://www.python.org/downloads/但是选择Anaconda来安装python集成环境更加简单。Anaconda的下载地址是:https://www.anaconda.com/distribution/Anaconda提供了三种操作系统的安装,此次博客基于windows64位,且python环境为3.7,

2020-07-02 19:01:43 1520

原创 CS231笔记 图像分类

图像分类定义图像分类就是已有固定的分类标签集合,对于新输入的图像,从分类标签集合中找出一个分类标签,最后把分类标签分配给该输入的对象。具体过程:图像分类训练出的模型读取该图片的信息,并且生成该图片属于集合{cat,dog,hat,mug}中各个标签的概率。图像信息等价于一个三维数组,也是我们熟知的RGB,有3个颜色通道,分别是红、绿和蓝。挑战从计算机视觉算法角度,识别一个图像的类别有以下挑战:视角变化、大小变化、形变、遮挡、光照条件、背景干扰、类内差异等,这些因素的存在,对计算机视觉算法充满着挑

2020-07-02 15:33:10 280

原创 考研复试-英语问答

英语问答1.What did you do during the outbreak?During the spring festival, all my families stayed at home to answer the call of the government . I cared a lot about the development of this issue persis...

2020-05-06 22:29:43 2130

原创 考研复试-计算机网络

计算机网络目录计算机网络1. OSI参考模型中计算机网络各层的主要功能2.中继器、集线器、网桥、交换机这4种网络互联设备的区别与联系1. OSI参考模型中计算机网络各层的主要功能OSI参考模型自下而上为物理层、数据链路层、网络层、传输层、会话层、表示层、应用层,其中:物理层:为数据端设备透明地传输原始比特流; 数据链路层:将网络层传来的IP数据报组装成帧,并且在不太可...

2020-05-06 22:12:52 299

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除