自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (2)
  • 收藏
  • 关注

原创 U-Net 学习记录

U-Net: Convolutional Networks for Biomedical Image Segmentation主要内容:背景及综述网络结构训练Trick实验结果背景(2015年)和综述卷积网络传统的应用领域是分类任务,其中图像的输出是单个的类标签。但是在许多CV任务尤其是生物医学图像领域, 所需的输出应该包括定位——类标签应该分配给每个像素。此外,得到成千上万的图像数据集在生物医学领域是很难实现的。本文在全卷积网络的基础上做了修改和扩展,以此能够用更少的训练图像并获得

2020-10-28 10:29:46 285

原创 关于类指针和类对象使用的问题

遇到的问题在写混音的时候,由于每路流的编码信息可能不一样,需要重采样为相同类型才能进行混音,所以每路流都需要一个重采样类实例。考虑内存问题,用指针应该是更好的选择,但是实际过程中,对类成员变量swrContext* 进行初始化的时候却报错了,改用类对象是可以的。参考了网上的一些博客,发现是因为类指针声明的时候没有分配内存的原因。测试了一下结果如下:int main() { ReSample re; ReSample *re_p1; ReSample *re_p2 = new ReSampl

2020-10-22 14:59:40 297

原创 【分享】 CV中关于pytorch在C++和python里的一些数据处理

简单介绍就我个人感觉而言pytorch比tensorflow简单很多,如果不了解pytorch的可以看看 知乎上的这个问题简单了解一下。由于数据处理暂时不涉及网络的搭建、模型的训练等,所以这里不讨论这些。我们使用的模型就是一个网络,网络的直接输入和输出都是tensor(计算由forward函数实现)。在我们的应用里输入和输出都是一帧帧的图像,而在C++里我们常用opencv里的mat来存储图片信息,所以重点就在于mat和tensor的相互转换。pytorch模型转换为torch script我们采用的

2020-10-09 18:05:09 268

原创 【学习记录】CSS 动画简单使用

之前我基本都没用过动画,一般都用canvas做一些画图之类的。在前几次的vilin开发中,有过几个动画效果的需求,于是我学习了一下css的动画,这里简单记录一下。css动画的特点就是简单,通过 css3创建的动画可以取代动画图片、Flash以及 JS等。常见CSS动画效果动画顾名思义可以动的图画,而这个“动”指的就是我们常见的图像变换:平移、旋转、放大、缩小,另外还包括颜色的变化:颜色加深变浅等。CSS里主要通过animation来实现元素的动画。图像变换用style里的transform属性来实

2020-09-12 14:02:59 162

原创 FFmpeg 混音学习【三】两路混流完整代码

前言本文是简单的混流实现,输入为两个媒体文件(音频或带音频的视频文件),输出为混流后的aac文件。完整代码/* * Copyright (c) 2010 Nicolas George * Copyright (c) 2011 Stefano Sabatini * Copyright (c) 2012 Clément BÅ“sch * * Permission is hereby granted, free of charge, to any person obtaining a copy

2020-07-17 11:51:55 2056 3

原创 FFmpeg 混音学习【二】FFmpeg aac音频多路混流普适情况filter初始化

前言接上一篇博客,上一篇中介绍了单路和双路混流,要是输入输出流多了像之前那样写就会很麻烦,于是考虑普适的情况,输入一个n初始化好对应的filter。具体实现定义要用到的结构体和类(里面一些参数的含义可以看我上一篇博客)输入流编码信息结构体:struct codec_info { int sample_rate; int channels; int64_t channel_layout; enum AVSampleFormat sample_fmt; AVRation

2020-07-13 11:39:17 816

原创 FFmpeg 混音学习【一】FFmpeg aac音频混流学习及问题记录

主要学习的是ffmpeg官方demo里的doc/examples/filtering_audio.cffmpeg混流的主要流程初始化filter读取aac数据,解码后将数据压入filter buffer中从buffer中取出数据编码成aac数据1、初始化filter首先定义需要使用到的变量: /** An instance of a filter */ static const char *filter_desc = "aresample=48000,aformat=sample

2020-07-11 22:34:57 1600

原创 html 输入框 oninput 事件,输入中文时多次被触发导致无法正常输入

问题:在开发公司的一个项目(scala、scalajs开发)时,遇到中文输入法无法正常输入的原因,如下图所示。经过同学提醒后,发现是oninput的问题,在中文输入法中,每输入一个拼音都会触发一次oninput而不是每输入一个字。那么解决办法呢,答案是使用compositionstart事件和compositionend事件。参考其他博客整理了一下js和scalajs版本。js版本//此部分代码摘自https://www.jianshu.com/p/e9c837eba083var typing =

2020-07-05 11:13:23 3190

原创 FFmpeg转码dash/hls等格式

本文以aac数据的转码为例,其他编码格式类似,关键是明白FFmpeg转码的原理,具体实现大同小异,转码的流程如下:主要使用的函数为:avformat_write_header()向目标文件写入文件头av_write_frame()/av_interleaved_write_frame()向目标文件写入数据av_write_trailer()结束写入目标文件主要流程如下(以下称转码器为muxer):首先调用avformat_alloc_context()来创建muxing上下文。这里初始

2020-06-26 16:05:00 1541

原创 C++ 判断文件夹是否存在和创建文件夹 (linux和windows)

在不同操作系统中创建文件夹所需要的头文件不太一样。Windows中需要如下头文件:#include <direct.h>#include <io.h>Linux中需要如下头文件:#include <sys/io.h>#include <unistd.h>#include <sys/stat.h>#include <sys/types.h>#include <dirent.h>具体代码实现如下:#if

2020-06-26 14:59:32 5802

原创 C++ Linux编译报错 jump to label ‘xxxx’ [-fpermissive]

在Linux上编译C++代码时报错 jump to label ‘xxxx’ [-fpermissive],看了下代码后发现是goto语句的问题,上网查了一下,原来是goto语句出现之后是不允许出现新声明的变量,所有新声明的变量需放在goto之前。例如:goto lab1; // 错 int a = 5;lab1:; --------------------------------------分割线------------------------------------------

2020-06-12 15:38:40 1887

转载 【转载】Linux下的tar压缩解压缩命令详解

转载:https://www.cnblogs.com/clovershell/p/10370314.htmltar-c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。-z:有gzip属性的-j:有bz2属性的-Z:有compress属性的-v:显示所有过程-O:将文件解开到标准输出下面的参数-f是必须的

2020-06-10 21:28:04 96

原创 Windows版libfdk-acc编译教程(二)

接上一篇博客,到这里网上其他的教程就已经结束了,但是我找了半天也没找到生成的头文件只有这个.lib文件。于是这个时候,我就想用这个.lib文件来重新编译ffmpeg。此时网上的教程众说纷纭,我看了很多,找一个稍微靠谱一点的链接。关于里面涉及的MinGW和msys,其实是不用分别安装的,因为最新版的MinGW里已经包含了msys,不用重复安装。之后打开MinGW Installation Manager,下载如下图所示的几个package。[upl-image-preview url=http://disc

2020-06-03 11:57:45 1062 2

原创 Windows版libfdk-acc编译教程(一)

这是这两天汗与泪的故事(由于网上很少有windows版本的编译过程,自己边借鉴边摸索了一个方法,不知道是不是最优的,目前写了个demo编码是可以的)。。。????由于FFmpeg本身带有的aac编码会存在较大的延时(其实是libfdk已经从ffmpeg独立出来),查阅资料确定选择libfdk-aac作为编解码工具,可以理解为libfdk-aac是当前最高质量的AAC编码。具体介绍可见此链接。下面为编译fdk-aac的过程:下载fdk-aac源码https://downloads.sourceforg

2020-06-03 11:40:57 2071

原创 dlib 编译出现USER_ERROR__inconsistent_build_configuration__see_dlib_faq_1 和2 的问题

编译dlib后,在使用它的时候报了这两个错USER_ERROR__inconsistent_build_configuration__see_dlib_faq_1一般是静态库没有引用上,可以检查一下cmake设置的路径,比如确定到具体某个.lib文件dlib release 编译的,项目也需要是release 编译的USER_ERROR__inconsistent_build_configuration__see_dlib_faq_2在dlib/config.h,最后一行增加:#def

2020-05-15 12:10:40 1359 2

ffmpeg_muxer.cpp

参考于ffmpeg官方示例教程和雷神代码,输入为一个音视频,转码输出为一个指定格式的音视频文件(包括dash/hls格式),转码具体介绍可见文章:https://blog.csdn.net/qq_37984341/article/details/106970319

2020-06-26

libfdk-aac Windows上编译用的CMakeLists.txt

Windows编译libfdk-aac时需要的CMakeLists文件,利用CMake Gui编译生成需要的库文件,详细用法可见https://blog.csdn.net/qq_37984341/article/details/106520723

2020-06-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除