qq_39862223-CSDN博客

原创近期论文阅读

[AAAI’21]ACSNet:Action-Context Separation Network for Weakly Supervised Temporal Action Localization从图中可以看出，左侧绿色框表示是动作类、红色框表示是动作上下文、蓝色框表示为背景类。通过右图的特征空间可见，蓝色的背景类特征与GT相差较远，但是红色的上下文类与GT高度相似，特别是在边界区域，这就导致上下文的误检。问题的引入：通过视频级别分类定位的前景不仅涉及实际操作实例，还涉及其周围的上下文。以前的方法利

2021-11-03 10:22:34 636 3

原创近期论文动态

1.弱监督的两大挑战1.1 动作完整性由于缺少帧级标签，若只根据注意力值进行动作定位，没有考虑到相邻帧之间可能存在相关性，可能导致出现信息丢失的问题。例如，对于动作“跳”，包含准备、跳、落地、恢复四个过程，其中准备和恢复过程在动作定位时对于跳的注意力值可能偏低，从而在定位时可能过滤到这两个部分，导致在弱监督动作定位过程中常会出现动作漏检的问题。1.2 上下文信息混淆由于缺少帧级标签，弱监督动作定位常会出现动作和背景混淆的问题，将背景误识别为动作，进而影响动作定位的精确性。2. 基于注意力机制的弱

2021-11-02 21:32:11 477

原创高维度思考法

1.解决问题的三个领域已知的已知=知道=知道自己知道——问题和答案均已知。这个对应既有的经验和知识。也就是说，已经发生过的事，可以共享、保存以便于以后活用。那也就意味着，这种问题是存在“正确的答案”的。应对的方法是“如何有效、准确、快速地解决问题”。已知的未知=不知道=知道自己不知道——问题已知而答案未知。这个一般指狭义的解决问题。比如，“知道成本低的产品更畅销但不知道该如何实现”产品的开发等，对应的就是这个领域。在这里，“问题已经给出"是大前提。未知的未知=不知道=不知道自己不知道——连问题都不知

2021-06-02 19:37:26 1390

原创图chuang

2021-05-19 11:05:46 146

原创爬虫学习

1.WEB的请求过程到底我们浏览器在输⼊完⽹址到我们看到⽹⻚的整体内容, 这个过程中究竟发⽣了些什么?这⾥我们以百度为例. 在访问百度的时候, 浏览器会把这⼀次请求发送到百度的服务器(百度的⼀台电脑), 由服务器接收到这个请求, 然后加载⼀些数据. 返回给浏览器, 再由浏览器进⾏显示. 听起来好像是个废话…但是这⾥蕴含着⼀个极为重要的东⻄在⾥⾯, 注意, 百度的服务器返回给浏览器的不直接是⻚⾯, ⽽是⻚⾯源代码(由html, css, js组成). 由浏览器把⻚⾯源代码进⾏执⾏, 然后把执⾏之后的结果

2021-05-17 10:08:30 143

原创看板-项目的有效管理

1.敏捷开发敏捷主张简洁、主张信息透明化，期望所有的信息都能通过一个醒目的辐射源影响到团队所有成员，以调动大家的积极性、主动性和自发性。而Scrum和看板则是这样一个可以将信息辐射给大家的工具。2.Scrum2.1 小故事一天，一只鸡散步时遇见了猪。鸡对猪说：“嗨，我们合伙开个餐厅吧。”猪说：“好啊，那准备取什么店名呢？”鸡说：“要不，就叫火腿和鸡蛋吧。”猪直接拒绝了：“那可不行。我要割肉，你只要下蛋。这样下去，我迟早要完蛋。”2.2 Scrum产生的背景这个故事实际上反映了软件开

2021-04-01 19:50:19 785

原创 GAN网络（实验）

3 GAN应用于手写数字识别我使用mnist手写数字来做数据集，通过生成对抗网络我们希望生成一些“以假乱真”的手写字体。为了加快训练过程，不使用卷积网络来做判别器，使用简单的多层网络来进行判别。3.1 定义判别器和生成器Discriminator Networkclass discriminator(nn.Module): def __init__(self): super(discriminator, self).__init__() self.dis

2021-03-02 13:33:20 1420 1

原创 GAN网络（理论）

1.GAN能做什么GAN的初衷就是生成不存在于真实世界的数据，类似于使得 AI具有创造力或者想象力。应用场景如下：AI作家，AI画家等需要创造力的AI体；将模糊图变清晰(去雨，去雾，去抖动，去马赛克等)，这需要AI具有所谓的“想象力”，能脑补情节；进行数据增强，根据已有数据生成更多新数据供以feed，可以减缓模型过拟合现象。2.GAN浅析2.1 GAN的基本结构GAN的主要结构包括一个生成器 G（Generator）和一个判别器 D（Discriminator）。例如，我们需要球员在球场

2021-03-01 15:13:54 1680 1

原创 CPM论文笔记

目录0.绪论1.CPM是什么？2.摘要3.本文方法3.1 Pose Machines3.2 Convolutional Pose Machines3.2.1 Keypoint Localization Using Local Image Evidence3.3 Sequential Prediction with Learned Spatial Context Features3.3 Learning in Convolutional Pose Machines0.绪论什么是人体姿态估计？人体.

2020-11-11 21:25:04 2257

原创 HRNet

论文链接：https://arxiv.org/abs/1902.09212代码链接：https://github.com/leoxiaobin/deep-high-resolution-net.pytorch论文源码分析：1 源码准备在指定文件夹下，输入命令：git clone https://github.com/leoxiaobin/deep-high-resolution-net.pytorch.git下载完成后，得到HRNet源码2 源码结构下表列出HRNet中比较重要的文件：.

2020-10-29 15:16:18 2341 5

原创 c3d

train.pyimport timeitfrom datetime import datetimeimport socketimport osimport globimport torchvisionfrom torch.nn.init import constant, normalfrom tqdm import tqdmimport torchfrom tensorboardX import SummaryWriterfrom torch import nn, optim.

2020-09-28 13:18:31 426

原创 C3D论文笔记

论文链接：http://vlg.cs.dartmouth.edu/c3d/c3d_video.pdf代码链接：https://github.com/jfzhang95/pytorch-video-recognition1. C3D是什么？C3D，全称Convolutional 3D，即3D卷积。3D卷积方法是把视频划分成很多固定长度的片段(clip)，相比2D卷积，3D卷积可以提取连续帧之间的运动信息，换句话说，3D卷积将视频多帧进行融合。2. 论文贡献3D ConvNets比2D ConvN.

2020-09-21 20:55:23 1616

原创 TSN源码分析

论文链接：https://arxiv.org/abs/1608.00859代码链接：https://github.com/yjxiong/tsn-pytorch1 源码准备在指定文件夹下，输入命令：git clone --recursive https://github.com/yjxiong/tsn-pytorch 下载完成后，得到tsn-pytorch源码。2 源码结构...

2020-09-09 14:36:48 3269 2

原创 TSN实验过程

论文链接：https://arxiv.org/abs/1608.00859代码链接：https://github.com/yjxiong/tsn-pytorch1.数据准备阶段1.1 数据集介绍在视频分类项目中，有很多经典的公开数据集，目前主要的数据集如列表所示：数据集视频数分类数发布年背景KTH60062004静态HMDB516766512011动态UCF101133201012012动态THUMOS-2014183941.

2020-09-08 11:26:45 8108 91

原创 TSN论文笔记

论文链接：https://arxiv.org/abs/1608.00859代码链接：https://github.com/yjxiong/tsn-pytorch1.TSN是什么？TSN，全称为temporal-segment-networks，即时间段网络。该网络是一种新的基于视频的动作识别框架，旨在通过基于分段的采样和聚合模块对长距离的时间结构建模。通过简单的平均池华和多尺度时间窗口的集成，该模型可以很容易地应用于修剪和未修剪视频中的动作识别。2.TSN面临的问题基于视频...

2020-09-05 16:11:43 2315 4

原创 Pycharm 单步调试

Pycharm 单步调试1.添加断点2.调试断点3.打印权重矩阵和偏置值4.源代码1.添加断点断点的添加如下图所示在代码前面左键单击即可2.调试断点点击那个绿色的甲虫图标，进行断点调试。点击调试按钮后，代码运行到第一个断点处点击Step Over 或者按F8，我们继续往下运行，到下一个断点，按钮如下图所示：可以看到，程序运行到新的断点处，并且在上一行代码中，显示W此时的值进行多次调试之后，可以看到许多变量的值，并且在不断的调试之中，动态变化。其中该代码总共有64个批次，每

2020-07-09 22:09:10 1729

原创 TensorFlow学习（4）非线性回归

1.核心代码这个程序为简单的三层结构组成：输入层、中间层、输出层import numpy as npimport matplotlib.pyplot as pltimport tensorflow as tf# 使用numpy生成200个随机点# 从-0.5到0.5范围均匀取200个点# np.newaxis增加维度# 最终成为200*1的数据x_data = np.linspace(-0.5, 0.5, 200)[:, np.newaxis]noise = np.random.n

2020-07-08 22:32:21 191

原创 TensorFlow学习（3）拟合线性函数k和b

拟合线性函数k和b代码import os# os.environ["TF_CPP_MIN_LOG_LEVEL"]='1' # 这是默认的显示等级，显示所有信息os.environ["TF_CPP_MIN_LOG_LEVEL"]='2' # 只显示 warning 和 Error# os.environ["TF_CPP_MIN_LOG_LEVEL"]='3' # 只显示 Errorimport tensorflow as tfimport numpy as np# 使用numpy生成

2020-07-08 17:55:07 513

原创 TensorFlow学习（2）变量

文字目录1.变量（Variable）2.创建及使用变量3.结果展示1.变量（Variable）在TensorFlow中，变量(Variable)是特殊的张量(Tensor)，它的值可以是一个任何类型和形状的张量。与其他张量不同，变量存在于单个 session.run 调用的上下文之外，也就是说，变量存储的是持久张量，当训练模型时，用变量来存储和更新参数。除此之外，在调用op之前，所有变量都应被显式地初始化过。2.创建及使用变量import tensorflow as tfx = tf.Vari

2020-07-08 16:22:00 288

原创 TensorFlow学习（1）创建图启动图

文章目录1.TensorFlow基本概念2.创建图启动图3.结果分析1.TensorFlow基本概念使用图（graphs）来表示计算任务在被称之为会话（session）的上下文（context）中执行图使用tensor表示数据使用变量（Variable）维护状态使用feed和fetch可以为任意的操作赋值或者从其中获取数据TensorFlow是一个编程系统，使用图（graphs）来表示计算任务，图中的节点称之为op（operation），一个op获得0个或多个tensor，执行计算，产生

2020-07-08 13:06:58 239

原创 TensorBoard MNIST 网络结构

1.mnist简介MNIST数据集是深度学习巨头-卷积网络之父Yann LeCun发布的一个供计算机视觉识别学习使用的手写数据识别的数据集。它包括60000个训练集和10000个测试集，每条数据（或者说每张图片）都是28x28x1类型，即图片的宽度为28，高度为28，通道数为1。且MNIST数据集已经把图片数据转换为标准的列表数据类型，如60000个训练集的数据格式是：[60000, 784]，表示有60000条数据，每条数据是784维(28x28=784)。我把mnist数据集下载至网盘，方便下载

2020-07-07 20:04:04 515

qq_39862223的博客