- 博客(7)
- 收藏
- 关注
原创 多模态模型知识点整理
一、多模态模型案例MiniGPT使用大型语言模型为MiniGPT-4构建视觉语言理解能力|微信登录可看视频回放 Minigpt-4:Enhancing Vision-language Understanding with Advanced Large Language Models GitHub - Vision-CAIR/MiniGPT-4ChatBridgeChatBridge: Bridging Modalities with Large Language Model as a Lang
2023-10-11 15:20:43 192
原创 Gstreamer/Core: Gstreamer 同步机制
1. 引言 我们知道多媒体的同步主要是为了能让多个流中具有相同时间戳(timestamp)的媒体资源在同一时刻被播放出来,比如播放电影时需要使得视频、音频同步的被播放出来,而不至于出现画面相对于声音超前或者落后的情况出现。 在Gstreamer中有一套同步机制,其所涉及到的内容包括buffer、segment、stream 以及 clock 。。。2. Clock
2015-07-28 16:20:59 4433
原创 OpenMAX/IL: OMX IL 学习笔记【1】- 接口与头文件
1. OpenMAX IL 层的接口定义是由若干个头文件的形式给出的,在头文件中定义了一些结构体和需要开发者实现的接口函数,包括:OMX_Types.h:OpenMax Il的数据类型定义OMX_Core.h:OpenMax IL核心的APIOMX_Component.h:OpenMax IL 组件相关的 APIOMX_Audio.h:音频相关的常量和数据结构OMX_IVCommon
2015-07-06 19:13:02 3259
原创 OpenMAX/IL: OMX IL 学习笔记【1】- 结构框架
OpenMAX IL 层 API 旨在为媒体组件提供跨平台的可移植能力。这些接口将系统的软硬件结构进行抽象化。每个组件及其相关的转换都被封装在组件接口的内部。OpenMAX IL API 允许用户去加载,控制,连接以及卸载各独立的组件。这种极具灵活性的内核结构使得 Intergration Layer 能够很容易的实现几乎所有的多媒体应用情形,并且能够很好的与现有的基于图像的多媒体框架相结合。
2015-06-23 16:52:13 5341
原创 Gstreamer/tools: gst-launch gst-inspect 用法示例
1. 查看 gst 中的 plugins 及其详细信息: $ gst-inspect 列出 gstreamer 中所有的 plugins $ gst-inspect alsasink 打印出 alsasink 的详细信息 $ gst-inspect --gst-debug all 打印出 G
2015-06-19 11:20:43 5748
原创 Gstreamer/Plugin-base/audiosink: AlsaSink AlsaSrc 结构解析
1. 引言 GstAlsaPlugin 是Gstreamer中的重要插件,其代码位于 gst-plugin-base 中,应用可以通过它来实现音频的采集和播放。 它是通过ALSA libary API封装实现的,相较于 gst-plugin-good 包中的GstPulsePlugin 实现更高效,延迟更低。在分析GstAlsaSink 和GstAlsaSrc 实现之前我们先了解一下
2015-06-19 10:54:49 5358 3
原创 Gstreamer/audioflingersink/APE: 使用palybin播放extrahigh,insane等级的ape音乐出现卡顿现象
解决方法:1. 增大 audioflingersink 中对 audiotrack 中 ringbuffer 大小的配置;diff --git a/gst/audioflingersink/gstaudioflingersink.cpp b/gst/audioflingersink/gstaudioflingersink.cppindex 840c3f3..7e
2015-06-09 17:01:04 1746 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人