Linux下视频编程

最新推荐文章于 2022-06-19 17:29:54 发布

langonghan

最新推荐文章于 2022-06-19 17:29:54 发布

阅读量5k

点赞数

文章标签： linux struct video buffer input 编程

本文链接：https://blog.csdn.net/langonghan/article/details/5673365

版权

关于Linux的视频编程(v4l2编程)

Posted on 星期一, 2月 23rd, 2009 at 11:47 下午

前言：目前正在忙于ARM 平台的Linux 应用程序的开发（其实是刚刚起步学习啦）。底层的东西不用考虑了，开发板子提供了NAND Bootloader ，和Linux 2.6 的源码，而且都编译好了。自己编译的bootloader 可以用，但是Linux 编译后，文件很大，暂且就用人家编译的系统，先专心写应用程序吧。。

正文：要做的任务是，把一块板子上的摄像头采集的图像和声卡采集的声音（貌似很啰嗦哈）通过TCP/IP 协议传输到另一块板子上。第一步，先把视频获取并且在本地LCD 上显示。看了板子提供的文档，视频传输需要用V4L2 的API 。

一. 什么是video4linux
Video4linux2 （简称V4L2), 是linux 中关于视频设备的内核驱动。在Linux 中，视频设备是设备文件，可以像访问普通文件一样对其进行读写，摄像头在/dev/video0 下。

二、一般操作流程（视频设备）：
1. 打开设备文件。 int fd=open(”/dev/video0″,O_RDWR);
2. 取得设备的capability ，看看设备具有什么功能，比如是否具有视频输入, 或者音频输入输出等。VIDIOC_QUERYCAP,struct v4l2_capability
3. 选择视频输入，一个视频设备可以有多个视频输入。VIDIOC_S_INPUT,struct v4l2_input
4. 设置视频的制式和帧格式，制式包括PAL ，NTSC ，帧的格式个包括宽度和高度等。
VIDIOC_S_STD,VIDIOC_S_FMT,struct v4l2_std_id,struct v4l2_format
5. 向驱动申请帧缓冲，一般不超过5 个。struct v4l2_requestbuffers
6. 将申请到的帧缓冲映射到用户空间，这样就可以直接操作采集到的帧了，而不必去复制。mmap
7. 将申请到的帧缓冲全部入队列，以便存放采集到的数据.VIDIOC_QBUF,struct v4l2_buffer
8. 开始视频的采集。VIDIOC_STREAMON
9. 出队列以取得已采集数据的帧缓冲，取得原始采集数据。VIDIOC_DQBUF
10. 将缓冲重新入队列尾, 这样可以循环采集。VIDIOC_QBUF
11. 停止视频的采集。VIDIOC_STREAMOFF
12. 关闭视频设备。close(fd);
三、常用的结构体( 参见/usr/include/linux/videodev2.h) ：

struct v4l2_requestbuffers reqbufs;// 向驱动申请帧缓冲的请求，里面包含申请的个数
struct v4l2_capability cap;// 这个设备的功能，比如是否是视频输入设备
struct v4l2_input input; // 视频输入
struct v4l2_standard std;// 视频的制式，比如PAL ，NTSC
struct v4l2_format fmt;// 帧的格式，比如宽度，高度等

struct v4l2_buffer buf;// 代表驱动中的一帧
v4l2_std_id stdid;// 视频制式，例如：V4L2_STD_PAL_B
struct v4l2_queryctrl query;// 查询的控制
struct v4l2_control control;// 具体控制的值

下面具体说明开发流程（网上找的啦，也在学习么）

打开视频设备

在V4L2 中，视频设备被看做一个文件。使用open 函数打开这个设备：

// 用非阻塞模式打开摄像头设备

int cameraFd ;

cameraFd = open (“/dev/video0″ , O_RDWR | O_NONBLOCK , 0);

// 如果用阻塞模式打开摄像头设备，上述代码变为：

//cameraFd = open(”/dev/video0″, O_RDWR, 0);

关于阻塞模式和非阻塞模式

应用程序能够使用阻塞模式或非阻塞模式打开视频设备，如果使用非阻塞模式调用视频设备，即使尚未捕获到信息，驱动依旧会把缓存（DQBUFF ）里的东西返回给应用程序。

设定属性及采集方式

打开视频设备后，可以设置该视频设备的属性，例如裁剪、缩放等。这一步是可选的。在Linux 编程中，一般使用ioctl 函数来对设备的I/O 通道进行管理：

extern int ioctl (int __fd , unsigned long int __request , …) __THROW ;

__fd ：设备的ID ，例如刚才用open 函数打开视频通道后返回的cameraFd ；

__request ：具体的命令标志符。

在进行V4L2 开发中，一般会用到以下的命令标志符：

VIDIOC_REQBUFS ：分配内存
VIDIOC_QUERYBUF ：把VIDIOC_REQBUFS 中分配的数据缓存转换成物理地址
VIDIOC_QUERYCAP ：查询驱动功能
VIDIOC_ENUM_FMT ：获取当前驱动支持的视频格式
VIDIOC_S_FMT ：设置当前驱动的频捕获格式
VIDIOC_G_FMT ：读取当前驱动的频捕获格式
VIDIOC_TRY_FMT ：验证当前驱动的显示格式
VIDIOC_CROPCAP ：查询驱动的修剪能力
VIDIOC_S_CROP ：设置视频信号的边框
VIDIOC_G_CROP ：读取视频信号的边框
VIDIOC_QBUF ：把数据从缓存中读取出来
VIDIOC_DQBUF ：把数据放回缓存队列
VIDIOC_STREAMON ：开始视频显示函数
VIDIOC_STREAMOFF ：结束视频显示函数
VIDIOC_QUERYSTD ：检查当前视频设备支持的标准，例如PAL 或NTSC 。

这些IO 调用，有些是必须的，有些是可选择的。

检查当前视频设备支持的标准

在亚洲，一般使用PAL （720X576 ）制式的摄像头，而欧洲一般使用NTSC （720X480 ），使用VIDIOC_QUERYSTD 来检测：

v4l2_std_id std ;

do {

ret = ioctl (fd , VIDIOC_QUERYSTD , &std );

} while (ret == -1 && errno == EAGAIN );

switch (std ) {

case V4L2_STD_NTSC :

// ……

case V4L2_STD_PAL :

// ……

}

设置视频捕获格式

当检测完视频设备支持的标准后，还需要设定视频捕获格式：

struct v4l2_format fmt ;

memset ( &fmt , 0, sizeof (fmt ) );

fmt .type = V4L2_BUF_TYPE_VIDEO_CAPTURE ;

fmt .fmt .pix .width = 720 ;

fmt .fmt .pix .height = 576 ;

fmt .fmt .pix .pixelformat = V4L2_PIX_FMT_YUYV ;

fmt .fmt .pix .field = V4L2_FIELD_INTERLACED ;

if (ioctl (fd , VIDIOC_S_FMT , &fmt ) == -1) {

return -1;

}

v4l2_format 结构体定义如下：

struct v4l2_format

{

enum v4l2_buf_type type ; // 数据流类型，必须永远是//V4L2_BUF_TYPE_VIDEO_CAPTURE

union

{

struct v4l2_pix_format pix ;

struct v4l2_window win ;

struct v4l2_vbi_format vbi ;

__u8 raw_data [200];

} fmt ;

};

struct v4l2_pix_format

{

__u32 width ; // 宽，必须是16 的倍数

__u32 height ; // 高，必须是16 的倍数

__u32 pixelformat ; // 视频数据存储类型，例如是//YUV4 ：2 ：2 还是RGB

enum v4l2_field field ;

__u32 bytesperline ;

__u32 sizeimage ;

enum v4l2_colorspace colorspace ;

__u32 priv ;

};

分配内存

接下来可以为视频捕获分配内存：

struct v4l2_requestbuffers req ;

if (ioctl (fd , VIDIOC_REQBUFS , &req ) == -1) {

return -1;

}

v4l2_requestbuffers 定义如下：

struct v4l2_requestbuffers

{

__u32 count ; // 缓存数量，也就是说在缓存队列里保持多少张照片

enum v4l2_buf_type type ; // 数据流类型，必须永远是V4L2_BUF_TYPE_VIDEO_CAPTURE

enum v4l2_memory memory ; // V4L2_MEMORY_MMAP 或 V4L2_MEMORY_USERPTR

__u32 reserved [2];

};

获取并记录缓存的物理空间

使用VIDIOC_REQBUFS ，我们获取了req.count 个缓存，下一步通过调用VIDIOC_QUERYBUF 命令来获取这些缓存的地址，然后使用mmap 函数转换成应用程序中的绝对地址，最后把这段缓存放入缓存队列：

typedef struct VideoBuffer {

void *start ;

size_t length ;

} VideoBuffer ;

VideoBuffer * buffers = calloc ( req .count , sizeof (*buffers ) );

struct v4l2_buffer buf ;

for (numBufs = 0; numBufs < req .count ; numBufs ++) {

memset ( &buf , 0, sizeof (buf ) );

buf .type = V4L2_BUF_TYPE_VIDEO_CAPTURE ;

buf .memory = V4L2_MEMORY_MMAP ;

buf .index = numBufs ;

// 读取缓存

if (ioctl (fd , VIDIOC_QUERYBUF , &buf ) == -1) {

return -1;

}

buffers [numBufs ].length = buf .length ;

// 转换成相对地址

buffers [numBufs ].start = mmap (NULL , buf .length ,

PROT_READ | PROT_WRITE ,

MAP_SHARED ,

fd , buf .m .offset );

if (buffers [numBufs ].start == MAP_FAILED ) {

return -1;

}

// 放入缓存队列

if (ioctl (fd , VIDIOC_QBUF , &buf ) == -1) {

return -1;

}

关于视频采集方式

操作系统一般把系统使用的内存划分成用户空间和内核空间，分别由应用程序管理和操作系统管理。应用程序可以直接访问内存的地址，而内核空间存放的是供内核访问的代码和数据，用户不能直接访问。v4l2 捕获的数据，最初是存放在内核空间的，这意味着用户不能直接访问该段内存，必须通过某些手段来转换地址。

一共有三种视频采集方式：使用read 、write 方式；内存映射方式和用户指针模式。

read 、write 方式 : 在用户空间和内核空间不断拷贝数据，占用了大量用户内存空间，效率不高。

内存映射方式：把设备里的内存映射到应用程序中的内存控件，直接处理设备内存，这是一种有效的方式。上面的mmap 函数就是使用这种方式。

用户指针模式：内存片段由应用程序自己分配。这点需要在v4l2_requestbuffers 里将memory 字段设置成V4L2_MEMORY_USERPTR 。

处理采集数据

V4L2 有一个数据缓存，存放req.count 数量的缓存数据。数据缓存采用FIFO 的方式，当应用程序调用缓存数据时，缓存队列将最先采集到的视频数据缓存送出，并重新采集一张视频数据。这个过程需要用到两个ioctl 命令,VIDIOC_DQBUF 和VIDIOC_QBUF ：

struct v4l2_buffer buf ;

memset (&buf ,0,sizeof (buf ));

buf .type =V4L2_BUF_TYPE_VIDEO_CAPTURE ;

buf .memory =V4L2_MEMORY_MMAP ;

buf .index =0;

// 读取缓存

if (ioctl (cameraFd , VIDIOC_DQBUF , &buf ) == -1)

{

return -1;

}

// …………视频处理算法

// 重新放入缓存队列

if (ioctl (cameraFd , VIDIOC_QBUF , &buf ) == -1) {

return -1;

}

关闭视频设备

使用close 函数关闭一个视频设备

close (cameraFd )

还需要使用munmap 方法。

附录：标准的V4l2 的API

http://v4l.videotechnology.com/dwg/v4l2.pdf

Tags: linux video , v4l2
Posted in arm/linux |

You can skip to the end and leave a response. Pinging is currently not allowed.

2.14 «

» 进展很不顺利。。。

10 comments

朱:

请问音频你是怎么处理的？最重要的问题是音频和视频采集后的同步问题？十分感谢！

3月 29th, 2009 at 7:48 下午

songzi:

音频用alsa的API。目前正要开始写音频。我用的i.mx27是上海的，声卡是集成在PMIC模块中。

3月 30th, 2009 at 9:48 下午

济南大卫:

请问，上海的imx27的板子，tv in 视频信号经过tvp5150后–>imx27–>tv out 没出现双屏现象吗？
我用的无锡矽太恒科的板子，可是出现双屏现象。他们说是奇偶场需要重组。我想这大概就是DQBUFF之后要做的工作吧？
可是他们不提供相应的测试程序。郁闷啊，原来他们给演示的只是他们的产品，哎，没办法。以前也没搞过。难啊。请问，你们想在的应用是怎样的，上海有没有给你们提供相关的源码啊？如果可能的话，能不能…嘿嘿，不好意思了，能不能给我们借鉴借鉴啊？

盼回复

谢谢

4月 26th, 2009 at 9:28 下午

songzi :

不好意思啊。。今天才看到你的留言。。我们没有用到tv-in的功能，也没有去测试代码。。查看邮箱，代码发过去了。

5月 2nd, 2009 at 1:07 上午

济南大卫:

松子您好，我现在正在读无锡那边提供的vpu测试程序，相信跟上海提供的差不多，有一些地方看不懂，想想你请教。相关问题已发到你的邮箱，其查收，谢谢。
GOD BLESS YOU

5月 6th, 2009 at 9:38 下午

songzi:

好像代码不一样，已经发过去了。。。：-）
为了验证代码对不对，你可以自己修改makefile然后编译一下看能不能通过。

5月 6th, 2009 at 10:17 下午

iPod :

大文章！我爱您的网站;

5月 27th, 2009 at 10:07 上午

songzi :

楼上的说得我都不好意思了。。。就是把自己遇到的问题真实地反映出来，既是方便他人也是给自己一个加强的记忆。。后面还会遇到很多问题，我会把整个项目里面遇到的主要的问题都在这里体现出来。。。

5月 28th, 2009 at 12:39 上午

济南大卫:

songzi你好，不知你看到我的邮件了吗，为什么我在DQBUF和Qbuf之间加入对视频数据的处理程序之后，输出的图像除了会按我的设想输出外，处理之前的图像还是会不时的闪现

盼答复
54216deren@163.com

6月 23rd, 2009 at 5:31 下午

rabbit512:

济南大卫：您好，我也刚卖了无锡的板子，用VPU采集回放测试一下，我的板子回放被分割成上下4个画面，现在您问题解决了没有？谢谢回复！QQ：154358818 rabbit512@163.com

7月 12th, 2009 at 12:24 上午

langonghan

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Linux下视频编程

关于Linux的视频编程(v4l2编程)Posted on 星期一, 2月 23rd, 2009 at 11:47 下午<br />前言：目前正在忙于ARM平台的Linux应用程序的开发（其实是刚刚起步学习啦）。底层的东西不用考虑了，开发板子提供了NAND Bootloader，和Linux 2.6的源码，而且都编译好了。自己编译的bootloader可以用，但是Linux编译后，文件很大，暂且就用人家编译的系统，先专心写应用程序吧。。<br />正文：要做的任务是，把一块
复制链接

扫一扫