HiddenTrackMJ-CSDN博客

原创 U-Net 学习记录

U-Net: Convolutional Networks for Biomedical Image Segmentation主要内容：背景及综述网络结构训练Trick实验结果背景（2015年）和综述卷积网络传统的应用领域是分类任务，其中图像的输出是单个的类标签。但是在许多CV任务尤其是生物医学图像领域，所需的输出应该包括定位——类标签应该分配给每个像素。此外，得到成千上万的图像数据集在生物医学领域是很难实现的。本文在全卷积网络的基础上做了修改和扩展，以此能够用更少的训练图像并获得

2020-10-28 10:29:46 300

原创关于类指针和类对象使用的问题

遇到的问题在写混音的时候，由于每路流的编码信息可能不一样，需要重采样为相同类型才能进行混音，所以每路流都需要一个重采样类实例。考虑内存问题，用指针应该是更好的选择，但是实际过程中，对类成员变量swrContext* 进行初始化的时候却报错了，改用类对象是可以的。参考了网上的一些博客，发现是因为类指针声明的时候没有分配内存的原因。测试了一下结果如下：int main() { ReSample re; ReSample *re_p1; ReSample *re_p2 = new ReSampl

2020-10-22 14:59:40 325

原创【分享】 CV中关于pytorch在C++和python里的一些数据处理

简单介绍就我个人感觉而言pytorch比tensorflow简单很多，如果不了解pytorch的可以看看知乎上的这个问题简单了解一下。由于数据处理暂时不涉及网络的搭建、模型的训练等，所以这里不讨论这些。我们使用的模型就是一个网络，网络的直接输入和输出都是tensor（计算由forward函数实现）。在我们的应用里输入和输出都是一帧帧的图像，而在C++里我们常用opencv里的mat来存储图片信息，所以重点就在于mat和tensor的相互转换。pytorch模型转换为torch script我们采用的

2020-10-09 18:05:09 298

原创【学习记录】CSS 动画简单使用

之前我基本都没用过动画，一般都用canvas做一些画图之类的。在前几次的vilin开发中，有过几个动画效果的需求，于是我学习了一下css的动画，这里简单记录一下。css动画的特点就是简单，通过 css3创建的动画可以取代动画图片、Flash以及 JS等。常见CSS动画效果动画顾名思义可以动的图画，而这个“动”指的就是我们常见的图像变换：平移、旋转、放大、缩小，另外还包括颜色的变化：颜色加深变浅等。CSS里主要通过animation来实现元素的动画。图像变换用style里的transform属性来实

2020-09-12 14:02:59 183

原创 FFmpeg 混音学习【三】两路混流完整代码

前言本文是简单的混流实现，输入为两个媒体文件（音频或带音频的视频文件），输出为混流后的aac文件。完整代码/* * Copyright (c) 2010 Nicolas George * Copyright (c) 2011 Stefano Sabatini * Copyright (c) 2012 ClÃ©ment BÅ“sch * * Permission is hereby granted, free of charge, to any person obtaining a copy

2020-07-17 11:51:55 2193 3

原创 FFmpeg 混音学习【二】FFmpeg aac音频多路混流普适情况filter初始化

前言接上一篇博客，上一篇中介绍了单路和双路混流，要是输入输出流多了像之前那样写就会很麻烦，于是考虑普适的情况，输入一个n初始化好对应的filter。具体实现定义要用到的结构体和类(里面一些参数的含义可以看我上一篇博客)输入流编码信息结构体：struct codec_info { int sample_rate; int channels; int64_t channel_layout; enum AVSampleFormat sample_fmt; AVRation

2020-07-13 11:39:17 872

原创 FFmpeg 混音学习【一】FFmpeg aac音频混流学习及问题记录

主要学习的是ffmpeg官方demo里的doc/examples/filtering_audio.cffmpeg混流的主要流程初始化filter读取aac数据，解码后将数据压入filter buffer中从buffer中取出数据编码成aac数据1、初始化filter首先定义需要使用到的变量： /** An instance of a filter */ static const char *filter_desc = "aresample=48000,aformat=sample

2020-07-11 22:34:57 1686

原创 html 输入框 oninput 事件，输入中文时多次被触发导致无法正常输入

问题：在开发公司的一个项目（scala、scalajs开发）时，遇到中文输入法无法正常输入的原因，如下图所示。经过同学提醒后，发现是oninput的问题，在中文输入法中，每输入一个拼音都会触发一次oninput而不是每输入一个字。那么解决办法呢，答案是使用compositionstart事件和compositionend事件。参考其他博客整理了一下js和scalajs版本。js版本//此部分代码摘自https://www.jianshu.com/p/e9c837eba083var typing =

2020-07-05 11:13:23 3255

原创 FFmpeg转码dash/hls等格式

本文以aac数据的转码为例，其他编码格式类似，关键是明白FFmpeg转码的原理，具体实现大同小异，转码的流程如下：主要使用的函数为：avformat_write_header（）向目标文件写入文件头av_write_frame（）/av_interleaved_write_frame（）向目标文件写入数据av_write_trailer（）结束写入目标文件主要流程如下(以下称转码器为muxer)：首先调用avformat_alloc_context（）来创建muxing上下文。这里初始

2020-06-26 16:05:00 1605

原创 C++ 判断文件夹是否存在和创建文件夹（linux和windows）

在不同操作系统中创建文件夹所需要的头文件不太一样。Windows中需要如下头文件：#include <direct.h>#include <io.h>Linux中需要如下头文件：#include <sys/io.h>#include <unistd.h>#include <sys/stat.h>#include <sys/types.h>#include <dirent.h>具体代码实现如下：#if

2020-06-26 14:59:32 6289

原创 C++ Linux编译报错 jump to label ‘xxxx’ [-fpermissive]

在Linux上编译C++代码时报错 jump to label ‘xxxx’ [-fpermissive]，看了下代码后发现是goto语句的问题，上网查了一下，原来是goto语句出现之后是不允许出现新声明的变量，所有新声明的变量需放在goto之前。例如：goto lab1; // 错 int a = 5;lab1:; --------------------------------------分割线------------------------------------------

2020-06-12 15:38:40 2258

转载【转载】Linux下的tar压缩解压缩命令详解

转载：https://www.cnblogs.com/clovershell/p/10370314.htmltar-c: 建立压缩档案-x：解压-t：查看内容-r：向压缩归档文件末尾追加文件-u：更新原压缩包中的文件这五个是独立的命令，压缩解压都要用到其中一个，可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。-z：有gzip属性的-j：有bz2属性的-Z：有compress属性的-v：显示所有过程-O：将文件解开到标准输出下面的参数-f是必须的

2020-06-10 21:28:04 110

原创 Windows版libfdk-acc编译教程（二）

接上一篇博客,到这里网上其他的教程就已经结束了，但是我找了半天也没找到生成的头文件只有这个.lib文件。于是这个时候，我就想用这个.lib文件来重新编译ffmpeg。此时网上的教程众说纷纭，我看了很多，找一个稍微靠谱一点的链接。关于里面涉及的MinGW和msys，其实是不用分别安装的，因为最新版的MinGW里已经包含了msys，不用重复安装。之后打开MinGW Installation Manager，下载如下图所示的几个package。[upl-image-preview url=http://disc

2020-06-03 11:57:45 1149 2

原创 Windows版libfdk-acc编译教程（一）

这是这两天汗与泪的故事(由于网上很少有windows版本的编译过程，自己边借鉴边摸索了一个方法，不知道是不是最优的，目前写了个demo编码是可以的)。。。????由于FFmpeg本身带有的aac编码会存在较大的延时（其实是libfdk已经从ffmpeg独立出来），查阅资料确定选择libfdk-aac作为编解码工具，可以理解为libfdk-aac是当前最高质量的AAC编码。具体介绍可见此链接。下面为编译fdk-aac的过程：下载fdk-aac源码https://downloads.sourceforg

2020-06-03 11:40:57 2236

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

HiddenTrack的博客