自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 【说明一下】我从来没有设置过vip文章,应该如何移除?

这个账号已经很久很久没有用了, 有朋友找到我以前写的帖子,问我怎么设置了VIP文章,我得申明一下,当年我发帖的时候没有做任何设置,后来也没有有意识的去做任何相关设置,中间也没有收到任何相关通知,我都根本不知道这事。请问一下,怎么批量地移除vip文章的标签,我还是想设置成任何人可见的。

2024-04-12 11:08:18 193

原创 FFmpeg中的object detection和classification

前段时间和Fu Ting同学一起为FFmpeg加了object detection和classification的相关功能,暂时告一段落,这里做个总结,记录一下备忘。首先,最新结构图镇贴。1. 用Docker演示用docker的方式,在linux系统(我用的是ubuntu18.04)执行如下命令$ cd /tmp/$ git clone https://github.com/guoyejun/ffmpeg_dnn.git/$ cd ffmpeg_dnn/$ cd docker/$ lsb

2021-06-15 10:05:36 544 1

原创 目标检测,FFmpeg中第一个基于深度学习模型的视频分析功能

2021年4月,终于把目标检测(object detection)加到FFmpeg upstream了,有maintainer身份加持,还是交互了将近100封邮件,花了两个多月才完成upstream,这还不包括前面的开发时间,当然,这么多的交流也对最后的代码有很大的提升。当前目标检测只支持OpenVINO后端,后续还将尽快加入更多功能,比如基于TensorFlow模型的目标检测、支持OpenVINO后端的目标识别、目标检测和识别结果的可视化等。有了这样的基础代码后,就方便进行很多扩展了,如有这样的事情发生

2021-04-20 08:55:30 802

原创 面向在校学生的谷歌编程实习项目(GSoC2021)

GSoC,即Google Summer of Code,是谷歌资助的编程实习生项目,面向全球的在校学生(包括本硕博),项目载体是代码程序。每年举办一次,今年2021年是第17次。学生地点任意,需自备电脑,通过网络联系。每年年初,符合条件的组织(Organization),一般都是开源组织,向Google提出申请,经过批准后,成为当年的GSoC Organization。每个组织,都会给出一些候选项目,包括项目内容、对学生的技能要求和指导者(mentor)等。今年一共有202个组织被批准,详见 https.

2021-03-24 09:25:03 2314

原创 三门问题图解

前段时间在一个帖子中看到三门问题的讨论,总觉得各种方法不是很直观,试着重新整理了一下,一直没有时间写出来,终于这两天可以写一下了。采用图解的方法,尽量的可以符合直觉。1. 问题描述三门问题(Monty Hall problem)亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论,大致出自美国的电视游戏节目Let's Make a Deal。问题名字来自该节目的主持人蒙提·霍尔(Monty Hall)。参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面

2021-02-12 11:32:55 1986

原创 用GPU加速FFmpeg中的超分辨率功能

1. 简要回顾首先简单复述一下FFmpeg中对深度学习的支持情况,如上图所示,FFmpeg在libavfilter中支持基于深度学习的filter,目前已经支持sr, derain和dnn_processing等filter,其中,dnn_processing是一个通用的filter,涵盖了sr和derain的功能,本文将要介绍的超分辨率(Super Resolution)功能也将使用dnn_processing来完成。为了实现模型推理功能,FFmpeg提供了三种不同的方式(被称为后端backend).

2021-02-11 21:50:03 729

原创 总是访问超时

看消息提醒总是服务连接已经超时什么的,可能要试几天时间不停尝试才能某个时间运气好看到都有什么具体内容,所以,以后可能就不一定能看到了。

2020-12-24 14:57:37 951

原创 用GPU加速FFmpeg中的超分辨率功能

1. 简要回顾首先简单复述一下FFmpeg中对深度学习的支持情况,如上图所示,FFmpeg在libavfilter中支持基于深度学习的filter,目前已经支持sr, derain和dnn_processing等filter,其中,dnn_processing是一个通用的filter,涵盖了sr和derain的功能,本文将要介绍的超分辨率(Super Resolution)功能也将使用dnn_processing来完成。为了实现模型推理功能,FFmpeg提供了三种不同的方式(被称为后端backend).

2020-11-22 14:22:50 1819 5

原创 在FFmpeg中使用OpenVINO推理引擎

在2020年7月初,我把对OpenVINO(Open Visual Inference & Neural Network Optimization)推理引擎的调用加到了FFmpeg中,也就意味着现在FFmpeg深度学习模块的后端有三个了,分别是TensorFlow、OpenVINO和Native,如下图所示。之前已经对TensorFlow和Native后端有过一些介绍,本文对如何使用OpenVINO后端做个简单介绍。编译和安装OpenVINOOpenVINO是Intel发布的一套深度学习框

2020-07-11 09:53:01 1316 2

原创 几个颜色基本属性的个人理解

在2018年下半年的时候,曾做过SDR2HDR的尝试(从以前的低/标准动态范围standard dynamic range到高动态范围high dynamic range),了解到平常熟视无睹的颜色概念背后的博大精深,还处于颜色的迷宫中,只是借助线性代数中向量空间的概念,稍微理清了一些概念,当时还和同学一起整理了个关于HDR基本概念的文档。最近看了微信公共号“领略颜色之雅”关于色相、饱和度和明度的视频资料,又碰巧看到了一些资料,在此记录一下对颜色属性的基本知识和个人理解,以免遗忘,。如有差错,肯定来自我的理

2020-05-16 08:09:49 2710

原创 FFmpeg中基于深度学习模型的图像处理filter:dnn_processing介绍(2)

dnn_processing是FFmpeg中的一个视频filter,可以支持所有基于深度学习模型的图像处理算法,即输入和输出都是AVFrame,而处理过程使用的是深度学习模型。为什么要开发这样一个filter,因为作为FFmpeg DNN模块的maintainer,希望可以有更多的人来使用这个模块,提出意见和批评,乃至发出patch来改善这个模块,dnn_processing就是一个很好的使用者入...

2020-04-08 08:39:50 1226

原创 FFmpeg中基于深度学习模型的图像处理filter:dnn_processing介绍(1)

在FFmpeg中,一开始增加了两个基于深度学习的video filter,分别是用来超分辨率的vf,和用来去除雨点的derain。它们都是对每帧中的内容进行的调整,包括对帧size的改变,用到的算法都是基于深度学习的模型。实际上,相比于这样为每一种功能算法增加一个filter的思路,我们还可以采用另外一种思路,即,设计一个通用的filter,可以用一个filter来普适所有基于深度学习模型的图像处...

2020-03-20 09:52:56 2032 1

原创 YOLO v2推理过程介绍

这大概是在2017年底的时候写的,当时还研究了一下faster rcnn和ssd的推理过程。后来YOLO v3出来了,这个就放在一边没理了。现在发出来凑个篇数。YOLO (You only look once) 是业界第一个端到端的图像目标检测方法,和Faster RCNN相比,不再需要RPN(region proposal network)来生成候选区域ROIs,因此,检测速度更快,更加可以满...

2020-02-27 12:07:54 2004

原创 ffmpeg中的roi encoding介绍

ROI (region of interest) encoding是一项基于感兴趣区域的视频编码技术,对图像中感兴趣的区域减少量化参数值(qp:quantization parameter),从而分配更多码率以提升画面质量,而对不感兴趣的区域则增加量化参数值(qp),从而分配更少码率(这部分区域的画面质量会因此有所下降),这样,在不损失图像整体质量的前提下,可以节省网络带宽占用和视频存储空间,或者...

2020-02-23 15:20:49 5077 3

原创 FFmpeg video filter FATE测试过程介绍

FATE (FFmpeg Automated Testing Environment) 是FFmpeg社区开发的自动化测试框架,支持对FFmpeg API的测试,也支持对FFmpeg内部函数的测试。对FFmpeg video filter的测试,就属于对API的测试。之前为了为一个video filter增加fate测试,大概研究了一下,感觉FFmpeg官方主页的资料还可以更详细,在酝酿写一篇介绍...

2020-02-23 15:04:29 1636 3

原创 FFmpeg深度学习模块2019年小结

FFmpeg是什么,通俗的说,在看片子的时候,需要用到视频播放器,而很多视频播放器的底层用的就是FFmpeg。这是我在2019年在FFmpeg深度学习模块中所做事情的总结,由于我在19年是这个模块的主要贡献者,所以,这个总结也差不多就是FFmpeg深度学习模块的现状总结了。在2018年的时候,Pedro Arthur ()带着学生Sergey Lavrushkin ()完成了一个GSoC项目,将...

2020-02-23 14:44:29 1324

原创 5. OpenGL综合知识 --- Memory类型和数据传递

从应用程序到驱动程序再到Frame buffer,粗略的,可以将memory分成四类:1.         CPU可读可写的,称为system memory。我们一般写的程序使用的memory都是这种类型的,比如OpenGL应用程序,OpenGL驱动程序中的部分memory2.         CPU可写GPU可读的,属于video memory,这种memory在驱动程序中具有重要意义,

2009-08-20 21:20:00 1621

原创 http访问自动编译结果

karrigell是一个web服务器,支持用python开发的脚本生成网页 # apt-get install karrigell# apt-get install karrigell-doc ps一下,就可以看到http服务器已经在运行了:/usr/bin/python /usr/share/karrigell/Karrigell.py /etc/karrigell/Karr

2009-08-19 16:48:00 584

原创 4. OpenGL综合知识 --- 窗口系统Windows和Linux/X

说明:在本节涉及的frame buffer是以显示为目的的frame buffer。 为了将GPU绘制结果在窗口中显示出来,必然需要将OpenGL和具体窗口系统相结合。如下图所示,OpenGL spec定义了GL context</span>的行为,从具体窗口衍生出frame buffer,两者结合,即可完成OpenGL应用程序的显示输出。当然,GL context的输出格式和

2009-08-15 14:52:00 3978 1

原创 自动构建

安装pysvn,可以在python脚本中访问subversion# apt-get install python-svn 有时候会用到nfs,安装服务端软件# apt-get install nfs-kernel-server  配置/etc/exports后重启# /etc/init.d/nfs-kernel-server restart  在一个无限循环

2009-08-13 10:41:00 817

原创 3. OpenGL综合知识---Frame Buffer

GPU的绘制结果并不一定直接写入on screen buffer中。On screen buffer中的数据是被用以显示输出的颜色信息,所以,on screen buffer属于color buffer。在OpenGL中定义了多个color buffer,比如front buffer、back buffer、left buffer等等,其中front buffer就是on screen buffe

2009-08-08 12:01:00 2733

原创 2. OpenGL综合知识---GL state和GL Context

 OpenGL定义了数百个以gl开头的函数(可称之为glAPI),供应用程序调用;OpenGL也规定了从glAPI到on screen buffer中数据的转换过程,即OpenGL的Pipeline。Pipeline直译的中文意思是管道,可以理解为将三维空间中表达的数据(比如三维物体、灯光配备等)经由这个管道转换为二维屏幕上的画面。如上图所示。  OpenGL Pipeline

2009-08-08 11:56:00 5044

原创 1. OpenGL综合知识---2D和3D

 考察计算机显卡最后输出到显示器的环节,有一块和屏幕分辨率一致的物理连续的memory,有一个名为Display Controller(?名称待确认)的硬件设备,该硬件将memory中的数据传递到显示设备中显示。此时,这块memory被称为on screen buffer。   可以同时存在多块memory,其内容都可以被Display Controller传给显示设备,而当前

2009-08-08 11:53:00 1471

原创 SubVersion服务器端配置

#svnadmin create scm 在文件scm/conf/passwd最后增加username = passwd这将是客户端使用svn的用户名和密码 修改文件scm/conf/svnserve.conf控制访问权限,去掉以下三行最前面的#anon-access = read auth-access = write password-db = passwd 注

2009-08-06 14:18:00 613

原创 介绍5---OpenGL Pipeline

之前讲述的都是将OpenGL Pipeline当中一个整体来看的,接下去,我们开始探索其内部了。  一. 顶点处理三维空间中的物体,从几何角度来说,是由多个顶点构成的,所以OpenGL Pipeline的第一个步骤就是顶点处理。计算每个顶点的属性,比如这个顶点在当前光照条件下应该是什么颜色的,在当前的视野下应该做的坐标变换等等。在这个步骤,每个顶点都是被独立处理的,不存在相互依

2009-07-25 11:32:00 2306

原创 介绍4---memory和client/server

很粗略的,我们可以从三个主要角度来看待memory:1. CPU可以读写的,称为system memory,我们一般写的程序都是使用system memory。2. CPU可写GPU可读的,属于video memory,这种memory在驱动程序中具有重要意义,是驱动程序软件和GPU硬件的桥梁。驱动程序往此memory写入硬件指令,GPU读取指令然后执行。3. CPU可读GPU可写的,

2009-07-24 13:28:00 1558 1

原创 介绍3---Frame Buffer

实际上,OGL的输出并不一定直接修改on screen buffer。有三种可能情况:1. 下图中的bufer就是on screen buffer,或者是on screen buffer的一部分,此时,OGL的输出直接修改on screen buffer的内容。【扩展】当应用程序以front buffer作为draw buffer,或者选择single buffer时,是这样的情况,但是屏

2009-07-24 10:29:00 1492 1

原创 介绍2---OpenGL和窗口系统

业界3D的标准主要有两个,一个是微软的Direct3D(或者简称D3D),另外一个则是OpenGL,在http://www.opengl.org/documentation/specs/可以看到其全部Spec。   OpenGL Spec定义了OpenGL pipeline的输入,即以gl开头的API函数(glAPI),也规定了pipeline的内部过程,以及其输出结果应该是什么,

2009-07-22 17:07:00 2073 1

原创 介绍1---什么是3D

考察计算机显卡最后输出到显示器的环节,有一块和屏幕分辨率大小一致的物理连续的memory,有一个名为Display Controller的硬件设备,该硬件将memory中的数据传递给显示器,进而在显示器屏幕screen显示。此时,这块memory被称为on screen buffer。换句话说,可以存在多块memory,其内容都可以被Display Controller传给显示设备,而当前被Dis

2009-07-22 16:04:00 2480 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除