自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(155)
  • 资源 (3)
  • 收藏
  • 关注

原创 web服务向微信推送消息

WxPusher (微信推送服务)是一个使用微信公众号作为通道的,实时信息推送平台,你可以通过调用API的方式,把信息推送到微信上,无需安装额外的软件,即可做到信息实时通知。你可以使用WxPusher来做服务器报警通知、抢课通知、抢票通知,信息更新提示等。即可通过web API或python API SDK向用户发送消息。

2024-03-01 15:42:22 557

原创 Vulkan-着色器及编译SPIR-V

Vulkan创建着色器

2023-09-28 17:54:51 2218

原创 Vulkan 简介

Vulkan在很大程度上汲取了AMD Mantle的灵感,但是进行了大幅度的扩展和增强,构成了一个完善的开发体系,功能和性能都十分丰富,拥有最新图形技术、通用目的计算、预编译着色器、多核心多线程高效率、底层驱动过载、横跨桌面/移动/主机/嵌入式、底层GPU硬件控制、精炼API。在高分辨率、高画质、需要GPU发挥的时候,Vulkan、OpenGL的速度基本差不多,但是随着分辨率的降低,CPU越来越重要,Vulkan逐渐体现了出来,尤其是看看GTX 980 Ti,最多可以领先OpenGL 33%之多!

2023-09-28 10:24:03 1091

原创 pyinstaller 生成exe

第一步安装pyinstaller。第二部生成xxx.spec。

2023-08-17 11:40:21 86

原创 01 常用视频编码器

常用H.264,HEVC,AV1视频编码标准软件编码器

2023-02-28 19:16:43 144

原创 FFplay流程分析

ffplay是基于ffmpeg的多媒体播放器例子,其基于ffmpeg和sdl实现。调用ffmpeg实现读取流媒体文件,去复用、解码,视频缩放、音频重采样等。调用sdl实现视频渲染、音频播放及其他时间相应。ffplay中线程采用SDL的线程模型实现,共有如下几个线程:读线程。读取文件、解封装 音频解码线程。解码音频压缩数据为PCM数据。 视频解码线程。解码视频压缩数据为图像数据。 音频输出线程。基于SDL播放,该线程实际上是SDL的内部线程。 视频输出线程。基于SDL播放,该线程为程序

2021-09-08 17:47:37 168

原创 安卓下获取USB音频设备名称

@TargetApi(23)privateList<String>getUSBAudioDeviceName(){UsbManagerusbManager=(UsbManager)_context.getSystemService(Context.USB_SERVICE);HashMap<String,UsbDevice>deviceList=usbManager.getDeviceList();Iterator<UsbDe...

2020-08-29 16:06:54 661

转载 语音识别中的CTC算法的基本原理解释

版权声明:本文为博主原创文章,未经博主允许不得转载。    https://blog.csdn.net/luodongri/article/details/80100297目前主流的语音识别都大致分为特征提取,声学模型,语音模型几个部分。目前结合神经网络的端到端的声学模型训练方法主要CTC和基于Attention两种。本文主要介绍CTC算法的基本概念,可能应用的领域,以及在结合神经网络进行C...

2018-10-21 22:46:44 493

转载 如何利用Deep CNN大幅提升识别准确率?

转自:    https://blog.csdn.net/u011292087/article/details/62054949近日,百度将 Deep CNN 应用于语音识别研究,使用了 VGGNet ,以及包含 Residual 连接的深层 CNN 等结构,并将 LSTM 和 CTC 的端对端语音识别技术相结合,使得识别错误率相对下降了 10% (原错误率的 90%)以上。    机器...

2018-10-21 22:37:42 1953

转载 (1)tensorflow语音识别 及 python音频处理库

版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/u012436149/article/details/71179314tensorflow 语音识别最近在做语音识别的项目,现在项目告一段落,就把最近碰到的东西做一个总结。一些资料 https://medium.com/@ageitgey/machine-learning-is-fun-part...

2018-10-21 22:29:34 1269

转载 干货|语音识别框架最新进展——深度全序列卷积神经网络登场

干货|语音识别框架最新进展——深度全序列卷积神经网络登场2016-08-05 17:03 转载 陈杨英杰1条评论导读:目前最好的语音识别系统采用双向长短时记忆网络(LSTM,LongShort Term Memory),但是,这一系统存在训练复杂度高、解码时延高的问题,尤其在工业界的实时识别系统中很难应用。科大讯飞在今年提出了一种全新的语音识别框架——深度全序列卷积神经网络(DFCNN...

2018-10-21 22:26:03 2271

转载 基于TensorFlow的车牌号识别系统

基于TensorFlow的车牌号识别系统(原英文链接:http://matthewearl.github.io/2016/05/06/cnn-anpr/) Tags: 车牌识别 TensorFlow简介过去几周我一直在涉足深度学习领域,尤其是卷积神经网络模型。最近,谷歌围绕街景多位数字识别技术发布了一篇不错的paper。该文章描述了一个用于提取街景门牌号的单个端到端

2017-09-19 16:35:27 1952

原创 TensorFlow升级到1.0版本的问题

BUG 1. AttributeError: ‘module’ object has no attribute ‘mul’# 解决方案:用tf.multiply替代tf.mul1212BUG 2. AttributeError: ‘module’ object has no attribute ‘sub’ 解决方案:用tf.subtract替代tf.sub# 解决方案:用t

2017-08-31 20:31:44 466

转载 tensorflow学习3--实现自编码器

深度学习之Tensorflow实现自编码器 当拥有很多的标注数据时,可以训练一个深层的神经网络。但是没有标注的数据时,依然可以利用无监督的自编码器来提取特征。自编码器(AutoEncoder),顾名思义,即可以使用自身的高阶特征编码自己。自编码器其实也是一种神经网络,它的输入和输出是一致的,它借助稀疏编码的思想,目标是使用稀疏的一些高阶特征重新组合来重构自己。因此,它的特点非常明显:第一,期望

2017-08-31 20:21:33 425

转载 deep learnling概念理解 --Dropout

前言  训练神经网络模型时,如果训练样本较少,为了防止模型过拟合,Dropout可以作为一种trikc供选择。Dropout是hintion最近2年提出的,源于其文章Improving neural networks by preventing co-adaptation of feature detectors.中文大意为:通过阻止特征检测器的共同作用来提高神经网络的性能。本篇博文就是按

2017-08-31 18:21:41 339

转载 tensorflow 学习2--- mnist测试

版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]简介mnist相当于ML和DL的hello world程序,通过对手写数字的图片进行训练,并对测试图片进行测试,验证其有效性数据集的准备有时候直接在代码中下载可能需要一些时间,或者提示IO error。因此在实际的使用过程中,会先下载好离线的数据下载地址相关链接 

2017-08-31 17:55:01 307

转载 神经网络回顾-Relu激活函数

1. 神经元模型以下引用自Poll的笔记:神经网络基础。  神经元是神经网络中最基本的结构,也可以说是神经网络的基本单元,它的设计灵感完全来源于生物学上神经元的信息传播机制。我们学过生物的同学都知道,神经元有两种状态:兴奋和抑制。一般情况下,大多数的神经元是处于抑制状态,但是一旦某个神经元收到刺激,导致它的电位超过一个阈值,那么这个神经元就会被激活,处于“兴奋”状态,进而向其他的神

2017-08-31 17:52:06 1539

转载 TensorFlow学习(1)

一、前言目前,深度学习已经广泛应用于各个领域,比如图像识别,图形定位与检测,语音识别,机器翻译等等,对于这个神奇的领域,很多童鞋想要一探究竟,这里抛砖引玉的简单介绍下最火的深度学习开源框架 tensorflow。本教程不是 cookbook,所以不会将所有的东西都事无巨细的讲到,所有的示例都将使用 python。那么本篇教程会讲到什么?首先是一些基础概念,包括计算图,graph

2017-08-29 20:47:43 298

转载 【TensorFlow报错】initialize_all_variables改为tf.global_variables_initializer

initialize_all_variables已被弃用,将在2017-03-02之后删除。 说明更新:使用tf.global_variables_initializer代替。

2017-08-29 14:56:53 410

转载 电磁兼容的设计方法介绍(五)

在介绍了关于电磁辐射的几个重要的观念后﹐我们将会针对修改对策方法与方向做一个介绍﹐以使得读者除了认识一些基本概念外﹐也能够实际的运用在产品的对策修改上。很多电磁兼容的对策工程师会发现﹐在面临电磁耐受性测试时﹐例好静电(ESD)或是涌浪突波(Surge)无法符合规格要求时﹐只要花很少的时间就能将问题解决﹐但是面临电磁干扰无法符合时﹐往往花了很长的时间修改﹐却不能获得有效的改善。这个差异在哪边呢﹖

2013-12-17 14:15:15 366

转载 电磁兼容的设计方法介绍(四)

九﹑电路板设计的考量在前章节有提到噪声辐射的主要来源有三个﹐一个是共模电压﹐一个是电流回路﹐另一个则是天线的长度﹐因此我们在电路板设计和Layout时﹐如何处理这些问题呢﹖也就是如何把这三个观念﹐充分运用在实际的电子产品设计中﹐便是本节所要讨论的重点了。当然我们第一个面临的课题﹐就是降低共模电压(VcM)﹐共模电压是存在哪边呢﹖基本上共模电压就是存在于接地上的噪声电压﹐在第六节中的共模和异

2013-12-17 14:13:59 292

转载 电磁兼容的设计方法介绍(四)

九﹑电路板设计的考量在前章节有提到噪声辐射的主要来源有三个﹐一个是共模电压﹐一个是电流回路﹐另一个则是天线的长度﹐因此我们在电路板设计和Layout时﹐如何处理这些问题呢﹖也就是如何把这三个观念﹐充分运用在实际的电子产品设计中﹐便是本节所要讨论的重点了。当然我们第一个面临的课题﹐就是降低共模电压(VcM)﹐共模电压是存在哪边呢﹖基本上共模电压就是存在于接地上的噪声电压﹐在第六节中的共模和异

2013-12-17 14:12:38 326

转载 电磁兼容的设计方法介绍(三)

七﹑阻抗的大小在前次的共模和异模讨论中有提到﹐共模Vcm电压的产生﹐是和共模电流及接地阻抗的大小有关﹐也就是VCM= ICM X RG一般来说Icm的电流往往不是我们所能控制﹐但是RG却是可以透过接地和屏蔽的方式来降低﹐因为能适当的降低RG﹐则相对的VCM就会降低﹐而噪声的辐射自然就跟着减小﹐至于要使得ICM降低﹐通常要处理到时脉频率(Clock)以及IC组件上的电压﹐这样

2013-12-17 14:11:34 284

转载 电磁兼容的设计方法介绍(二)

五﹑I/O Cable的天线效应在了解产生辐射的条件后﹐接下来就是要知道产品有哪些地方会造成天线效应﹐对一般摆在桌上大小的产品﹐I/O电缆(Cable)正好就是一个天线﹐前面有提到有辐射就会有天线﹐因此I/O电缆是最重要﹑最有效的辐射机制。在对策时很多时候只要把周边电缆拿掉﹐噪声就是见或是降低﹐电缆一加上则噪声就出现﹐所以我们要先针对这条电缆线来处理﹐而不是先去修改产品内部主板(Mainb

2013-12-17 14:10:04 367

转载 电磁兼容的设计方法介绍(一)

一﹑前言关于电磁兼容的要求﹐目前世界上大多的先进国家﹐都已经有管制的法规并有相关的符合要求的单位﹐若产品无法符合要求规定﹐往往无法销售到该地区的市场﹐因此多数的电子产品﹐在销售前都必须经过电磁兼容的测试﹐若无法通过则需要经过适当的修改﹐来符合相关的规定。本文主要是说明﹐在电子产品设计的阶段﹐如何考虑避免电磁干扰的产生﹐和增加产品耐干扰的程度﹐从许多的经验得知﹐若能在设计开始的阶段﹐就能适当

2013-12-17 14:08:20 580

转载 live555—VS2010 下live555编译、使用及测试

【流媒體】live555—VS2010 下live555编译、使用及测试SkySeraph Apr 11st 2012Email:[email protected]    QQ:452728574Ⅰ live555简介  Live555 是一个为流媒体提供解决方案的跨平台的C++开源项目,它实现了对标准流媒体传输协议如RTP/RTCP、RTSP、SIP等的支持。Live5

2013-11-25 17:36:18 425

转载 用live555和ffplay搭建流媒体环境

vc6-live555工程里还有很多实例,也同样值得很好的研究。网上有很多讲解live555配置及工程源代码的资料,可以找来看看。打开vc6-live555下面的live555.dsw编译,编译可以一次性通过,并会在bin目录下生成live555MediaServer.exe文件,我们可以拖几个媒体文件到这个目录下,注意一定要和live555MediaServer.exe放在同一目录。之后运行

2013-11-25 17:31:10 464

转载 ffplay程序运行流程分析

1、main()开始: 分别注册编解码器,复用以及解复用器[cpp] view plaincopyprint?avcodec_register_all(); //register codec  avdevice_register_all();  av_register_all();  //register demux and mux  接

2013-11-25 17:23:29 698

转载 提升基于英特尔®架构的 Android* 模拟器的速度

http://software.intel.com/zh-cn/speeding-up-the-android-emulator-on-intel-architecture/?utm_campaign=CSDN&utm_source=intel.csdn.net&utm_medium=Link&utm_content=%20intelandroid%20-jiasuqi

2013-10-29 10:37:07 273

转载 TTL电平与COMS电平比较

文章出自:http://www.360doc.com/content/11/0415/18/1317564_109884559.shtml

2013-10-29 10:35:33 320

转载 安装ADT 提示 android ADT Unable to connect to repository

以往安装ADT根本就不是个问题,可是现在就是个大问题了,联通的宽带网络连www.google.com.hk都打不开,你叫我们这些P民怎么活? https://dl-ssl.google.com/android/eclipse http://dl-ssl.google.com/android/eclipse都无法正常访问,会提示android ADT Unable to connect

2013-10-24 19:38:39 2290 1

转载 H264 NAL类型语义:序列参数集层(SPS) & 图像参数集语义

1: seq_parameter_set_rbsp( ) { 2: // profile_idc level_idc 指明所用 profile、level 3: profile_idc 4: // constraint_set0_flag 等于 1 时表示必须遵从附录 A.2.1 所指明的所有制约条件。等于 0 时表

2013-09-26 17:39:56 527

转载 H.264中的NAL单元类型 nal_unit_type

nal_unit_typeNAL 单元和 RBSP 语法结构的内容  0未指定 1一个非IDR图像的编码条带 slice_layer_without_partitioning_rbsp( ) 2编码条带数据分割块A slice_data_partition_a_layer_rbsp( ) 3编码条带

2013-09-26 17:33:43 300

转载 H264--4--H264编码

-----------------------------------编码器输出格式----------------------------------        总的来说H264的码流的打包方式有两种,一种为annex-b byte stream format的格式,这个是绝大部分编码器的默认输出格式,就是每个帧的开头的3~4个字节是H264的start_code,0

2013-09-26 17:23:31 576

转载 H264--5--H264解码

解码器在解码时,首先逐个字节读取NAL的数据,统计NAL的长度,然后再开始解码。 nal_unit( NumBytesInNALunit ) {  /* NumBytesInNALunit为统计出来的数据长度 */       forbidden_zero_bit    // forbidden_zero_bit  等于 0表示网络传输没有出错     nal_ref_idc //

2013-09-26 17:21:44 253

转载 H264--3--NAL层的处理

------------------------------H.264的NAL层处理------------------------------H264以NALU(NAL unit)为单位来支持编码数据在基于分组交换技术网络中传输。NALU定义了可用于基于分组和基于比特流系统的基本格式,同时给出头信息,从而提供了视频编码和外部世界的接口。H264编码

2013-09-26 17:21:31 298

转载 H264--2--语法及结构

---------------前言-------------H264结构中,一个视频图像编码后的数据叫做一帧,一帧由一个片(slice)或多个片组成,一个片由一个或多个宏块(MB)组成,一个宏块由16x16的yuv数据组成。宏块作为H264编码的基本单位。-------------------------名词解释---------------------

2013-09-26 17:20:21 266

转载 H264--1--编码原理以及I帧B帧P帧

-----------------------前言-----------------------       H264是新一代的编码标准,以高压缩高质量和支持多种网络的流媒体传输著称,在编码方面,我理解的他的理论依据是:参照一段时间内图像的统计结果表明,在相邻几幅图像画面中,一般有差别的像素只有10%以内的点,亮度差值变化不超过2%,而色度差值的变化只有1%以内。所以对于一

2013-09-26 17:18:18 286

转载 实现RTP协议的H.264视频传输系统

1.  引言       随着信息产业的发展,人们对信息资源的要求已经逐渐由文字和图片过渡到音频和视频,并越来越强调获取资源的实时性和互动性。但人们又面临着另外一种不可避免的尴尬,就是在网络上看到生动清晰的媒体演示的同时,不得不为等待传输文件而花费大量时间。为了解决这个矛盾,一种新的媒体技术应运而生,这就是流媒体技术。流媒体由于具有启动时延小、节省客户端存储空间等优势,逐渐成为人们的首选,流媒

2013-09-26 17:16:14 401

转载 VLC播放YUV文件

文件扩展名需为.yuv,每秒5帧播放像素格式为UYVY分辨率为704x576的yuv文件的步骤如下: 1、运行VLC 2、“媒体”-》“高级打开文件...”菜单项调出“打开媒体”对话框 3、添加文件4、选中“显示更多选项”,在“编辑选项”中输入:demux=rawvideo :rawvid-width=704 :rawvid-height=576 :rawvid-c

2013-09-25 17:20:12 3303 1

GV7601.pdf

该文档为GV7601的Datasheet,详细说明了GV7601的功能和各种使用细节,方便用户进行设计

2013-09-06

GV7601_Aviia_Receiver.pdf

该文档介绍了GV7601的功能、输入输出等特性

2013-09-06

qt creater

qt开发:详细介绍qt-creater的使用及qt编程入门

2013-07-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除