图像与音视频
文章平均质量分 75
hjwang1
让Robot走入社会、融入生活,方便人与人、人与物、物与物之间的沟通,丰富人们的生活
======
人工智能是分主观与客观的,是硬币的两个方面
客观智能是世界的本质描述,是物理的是数学的
主观智能是来自于客观智能,是哲学的是宗教的
如果抛开物理与数学只去讲方法是绝对走不远的
而单讲物理与数学只会得到一个静默缤纷的世界
展开
-
【Python】解决使用 plt.savefig 保存图片时一片空白
ref:https://blog.csdn.net/qq_30638831/article/details/80060045问题当使用如下代码保存使用plt.savefig保存生成的图片时,结果打开生成的图片却是一片空白。import matplotlib.pyplot as plt """ 一些画图代码 """ plt.show()plt.savefig("filename.png")原因其实产生这个现象的原因很简单:在plt.show()后调用了plt.save...转载 2021-04-21 20:38:02 · 1795 阅读 · 0 评论 -
YUV数据格式转换&align
ref:https://blog.csdn.net/u010842019/article/details/52086103 第一幅是Y分量描述黑白图像第二幅是U(V)分量描述第三幅是V(U)分量描述第四幅是YUV三幅合成后得到的正常图像1. YUV简介YUV是一种颜色编码方法,它和我们熟知的RGB红绿蓝颜色体系相对应,它们之间能通过公式相互转换。而YUV区别于RGB的重要一点是采用YUV色彩空间亮度信号Y和色度信号U、V是分离的,这样就使得亮度Y...转载 2021-04-01 18:05:30 · 1642 阅读 · 0 评论 -
ffmpeg pixel format
ref:https://blog.csdn.net/fanbird2008/article/details/8481552const AVPixFmtDescriptor av_pix_fmt_descriptors[AV_PIX_FMT_NB] = { [AV_PIX_FMT_YUV420P] = { .name = "yuv420p", .nb_components = 3, .log2_chroma_w = 1, .log2转载 2021-04-01 17:05:01 · 1171 阅读 · 0 评论 -
计算机图形学十一:几何3—曲面细分(Mesh subdivision)与曲面简化(Mesh Smplication)
ref:https://blog.csdn.net/qq_38065509/article/details/106154299http://hhoppe.com/newqem.pdf曲面细分与曲面简化摘要 1 曲面细分(Mesh Subdivision) 1.1 Loop细分(Loop Subdivision) 1.2 Catmull-Clark细分(Catmull-Clark Subdivision) 2 曲面简化(Mesh Smplication) 总结 Referen转载 2021-02-22 17:17:12 · 1042 阅读 · 0 评论 -
聊聊手机上使用的防抖技术
ref:微信公众号MyWishList文章Original from Laze Sun MyWishList 2020-10-16本周三早上一点,苹果发布了 iPhone 12 系列,在发布会后,不乏有网友希望我们来详细讲解一下 iPhone 12 Pro Max 上首发的传感器位移式光学图像防抖究竟是个什么玩意儿。所以我们这次就从最基础的传统电子防抖出发,以时间为顺序一点点向各位科普手机上的防抖技术都有哪些。1.传统电子防抖实际上电子防抖在手机上的出现比我们想象中早得多。早..原创 2021-02-20 15:04:20 · 3339 阅读 · 3 评论 -
OpenCV中的findContours函数参数详解
ref:https://blog.csdn.net/dcrmg/article/details/51987348注: 这篇文章用的OpenCV版本是2.4.10, 3以上的OpenCV版本相关函数可能有改动Opencv中通过使用findContours函数,简单几个的步骤就可以检测出物体的轮廓,很方便。这些准备继续探讨一下findContours方法中各参数的含义及用法,比如要求只检测最外层轮廓该怎么办?contours里边的数据结构是怎样的?hierarchy到底是什么鬼?Po..转载 2021-01-26 12:09:59 · 4485 阅读 · 1 评论 -
opencv截取图像中某一区域的方法:通过Rect
ref:https://blog.csdn.net/weixin_41770169/article/details/87345224Mat图像存储:Mat image= imread(image);Rect rect(10, 20, 100, 50);Mat image_roi = image(rect);Rect介绍:https://blog.csdn.net/kh1445291129/article/details/51149849//如果创建一个Rect对象rect(100转载 2021-01-26 10:06:51 · 5689 阅读 · 0 评论 -
Ubuntu: 查看图像像素坐标
ref:https://blog.csdn.net/sss_369/article/details/98124111介绍UBuntu下查看图像像素坐标的软件mtPoint安装命令:sudo apt-get install mtpaintrun:mtpaint >/dev/null 2>&1 &转载 2021-01-25 11:36:34 · 1666 阅读 · 1 评论 -
OpenCV 透视变换cv::getPerspectiveTransform()与cv::warpPerspective()详解
ref:https://blog.csdn.net/guduruyu/article/details/72518340透视变换(Perspective Transformation)是将成像投影到一个新的视平面(Viewing Plane),也称作投影映射(Projective Mapping)。如图1,通过透视变换ABC变换到A'B'C'。图1 透视变换示意图透视变换的通用公式为:变换后的坐标x,y分别为:。展开之后即:其中,称为透视变换矩阵:表示线性变换,如scali转载 2021-01-13 14:14:46 · 1432 阅读 · 1 评论 -
OpenCV 文字绘制cv::putText详解
ref:https://blog.csdn.net/guduruyu/article/details/68491211https://blog.csdn.net/keith_bb/article/details/53366674opencv中除了提供绘制各种图形的函数外,还提供了一个特殊的绘制函数——在图像上绘制文字。这个函数即是cv::putText()。具体形式如下: void cv::putText( cv::Mat& img, // 待绘制的图像 const str转载 2021-01-11 17:15:56 · 17923 阅读 · 0 评论 -
使用 FFmpeg 将YUV数据编码为视频文件
ref:https://www.cnblogs.com/renhui/p/10504851.html本文中实现的一个小功能是把一个YUV原始视频数据(时间序列图像)经过h264编码为视频码流,然后在使用mp4封装格式封装。编码&封装的流程图如下:使用ffmpeg编码流程:1、首先使用av_register_all()函数注册所有的编码器和复用器(理解为格式封装器)。该步骤必须放在所有ffmpeg代码前第一个执行2、avformat_alloc_output_context2(转载 2021-01-07 11:09:06 · 2472 阅读 · 0 评论 -
matlab VideoReader
ref:https://blog.csdn.net/shuoshuge/article/details/86131557clc;clear;%obj = VideoReader('filename.mp4');obj = VideoReader('filename.avi'); %读取视频% obj.CurrentTime = 0.5;% currAxes = axes;% while hasFrame(obj)% vidFrame = readFrame(obj);%转载 2020-12-17 15:33:23 · 651 阅读 · 0 评论 -
diverging colormap bwr
ref:http://blog.sciencenet.cn/blog-69686-1160800.htmlREDBLUE(M)是一个M x 3的矩阵,它定义了一种颜色映射关系。REDBLUE(M), is an M-by-3 matrix that defines a colormap.颜色变化从亮蓝色开始,范围从蓝色到白色,然后从红色到亮红色。The colors begin with bright blue, range through shades of blue to whi..转载 2020-12-08 10:21:19 · 708 阅读 · 1 评论 -
COLORMAP_JET的颜色规律
ref:https://blog.csdn.net/qq_41498261/article/details/1096039861. COLORMAP_JET简介计算机视觉中最常用的颜色映射算法是Jet,它具有高的对比度可以有效突出图像中的细节。但如果仔细观察图像的梯度图会发现一系列的颜色带,在青色和黄色区域最为明显。缺点:这对于伪彩图最大的影响在于颜色变化过于剧烈,将导致人眼对于实际数据的误解。很多平滑过渡的区域会被误解为有较大的梯度。由于Jet映射对于人眼感知来说变化不是常量,所以它不具有感知转载 2020-12-08 10:18:32 · 7320 阅读 · 2 评论 -
基于OpenCV读取MP4文件并保存视频帧为图片C++
ref:https://blog.csdn.net/qq_37716188/article/details/109057659#include <iostream>#include <string>#include <opencv2/opencv.hpp>using namespace std;using namespace cv;#define interval 4 //修改这里以改变多久保存一帧int main(){ VideoCaptu转载 2020-12-04 21:28:35 · 2758 阅读 · 1 评论 -
手机液态镜头有望近期商业落地
液态镜头有望于在手机上落地应用,可能会是华为P50系列,低功耗、快速自动对焦、光学变焦、光学防抖,防畸变、夜景成片率高,这是继自由曲面镜头之后的又一milestone原创 2020-11-30 21:03:57 · 224 阅读 · 1 评论 -
华为新手机采用自由曲面镜头,理工男的浪漫or追求技术的极致
文章来源:前瞻网,作者:Winnie Lee近日华为发布了Mate 40 Pro+新机,通过详细参数可以看到,作为一款旗舰机型,Mate 40 Pro+采用的诸多新技术无疑是非常值得关注的,其中最值得一提的就是手机镜头的升级。如此前爆料,新 手机的超广角摄像头采用了业界首款自由曲面镜头,有不少媒体曾评价为“华为手机做了 使用自由曲面镜头的第一个吃螃蟹的人”。这款自由曲面镜头到底有什么新奇的?根据华为官方宣传,Mate40 Pro+手机中的超广角镜头由于引入了自由曲面,镜头的成像质量非常高,系转载 2020-11-30 16:53:35 · 1482 阅读 · 0 评论 -
OPPO 人像视频科技
原文链接:https://events.oppo.com/cn/innoday2020/当 5G 概念刚推出时,有专家预言“5G 时代,视频先火”。伴随 5G 技术的成熟应用,促进网络视听技术往更专业化与精细化发展,人们对视频体验要求提高,因此 5G 时代不断催生众多视频新业态与场景体验。据数据统计,短视频行业市场规模极速增长,2019 年短视频行业市场规模达 1006.5 亿元,同比增长 115.5%,预计 2020 年将超 1500 亿,2021 年超 2000 亿,视频行业发展前景巨大。视转载 2020-11-25 10:52:39 · 417 阅读 · 0 评论 -
RGB、YUV和HSV颜色空间模型
ref:https://www.cnblogs.com/justkong/p/6570914.html一、概述颜色通常用三个独立的属性来描述,三个独立变量综合作用,自然就构成一个空间坐标,这就是颜色空间。但被描述的颜色对象本身是客观的,不同颜色空间只是从不同的角度去衡量同一个对象。颜色空间按照基本机构可以分为两大类:基色颜色空间和色、亮分离颜色空间。前者典型的是RGB,后者包括YUV和HSV等等。二、RGB颜色空间1、计算机色彩显示器和彩色电视机显示色彩的原理一样,都是采用R、G、B相加混色转载 2020-11-13 14:32:04 · 358 阅读 · 0 评论 -
fmpeg获取视频的总帧数
ref:https://blog.csdn.net/u010368556/article/details/102943897在ffmpeg中通常使用 ffprobe来获取视频流的总帧数;这种类型的任务是ffprobe擅长的。命令行:ffprobe -v error -count_frames -select_streams v:0 -show_entries stream=nb_read_frames -of default=nokey=1:noprint_wrappers=1 input.m转载 2020-10-20 10:43:20 · 7080 阅读 · 0 评论 -
Ubuntu 16.04 安装Opencv 3.4.3
ref:https://www.jianshu.com/p/f646448da265https://blog.csdn.net/u013066730/article/details/79411767去官网下载opencv,在本教程中选用的时opencv3.4.3,其他版本的配置方法异曲同工。下载链接 http://opencv.org/releases.html,选择sources版本。unzip opencv-3.4.3.zipcd opencv-3.4.3sudo apt-g.转载 2020-08-26 19:06:49 · 233 阅读 · 0 评论 -
Ubuntu 18.04 CPU 安装 OpenCL
下载 OpenCl SDK https://software.intel.com/content/www/us/en/develop/tools/opencl-sdk/choose-download.html,选择linux平台,解压。sudo ./install.sh安装 clinfo$ clinfoNumber of platforms 1 Platform Name ...原创 2020-08-06 10:51:21 · 1713 阅读 · 1 评论 -
Image Alignment and Stitching A Tutorial
ref:https://tongtianta.site/paper/57879https://tongtianta.site/paper/57873https://tongtianta.site/paper/22703https://tongtianta.site/paper/57851论文:http://static.tongtianta.site/paper_pdf/ae57194c-e979-11e9-a0f3-00163e08bb86.pdfRichard Szeliski原创 2020-06-15 15:12:21 · 1004 阅读 · 0 评论 -
图像处理中振铃现象
转自:https://blog.csdn.net/u010839382/article/details/41971603图像处理中,对一幅图像进行滤波处理,若选用的频域滤波器具有陡峭的变化,则会使滤波图像产生“振铃”,所谓“振铃”,就是指输出图像的灰度剧烈变化处产生的震荡,就好像钟被敲击后产生的空气震荡。如下图:由卷积定理可将下面两种增强联系起来:频域增强:空域卷积:...转载 2020-04-23 15:17:10 · 2742 阅读 · 0 评论 -
相机等效焦距和视场角计算
ref:https://blog.csdn.net/W_AYF0726/article/details/88534901计算视场角tanA = 0.5*width*dy/f = 0.5*width/(f/dy)= 0.5*width/fy = xFOV = 2*arctan(x)针对直线投射镜头(无空间扭曲)产生的遥远物体影像,有效焦距与影像格式尺寸足以定义视角。 ...转载 2020-04-15 17:35:23 · 20964 阅读 · 2 评论 -
[图像]畸变校正详解
ref:https://blog.csdn.net/humanking7/article/details/45037239https://blog.csdn.net/weixin_38009585/article/details/823560221.摄像机成像原理简述成像的过程实质上是几个坐标系的转换。首先空间中的一点由 世界坐标系 转换到 摄像机坐标系 ,然后再将其投影到成像平面 (...转载 2020-01-22 14:32:04 · 3759 阅读 · 5 评论 -
YUV格式图像基础
ref:https://www.jianshu.com/p/4f31bcc6da791.YUV基础yuv是一种类似rgb的颜色模型,起源于黑白和彩电的过渡时期。其中Y代表亮度,uv组合起来可以表示色度。yuv信息只有y的信息就足以显示黑白的图片,yuv和YCbCr表示相同的东西,且Cb严格对应U,Cr严格对应V,yuv和rgb可以通过固定公式进行转换。yuv转rgb:yuv转r...转载 2019-11-21 10:25:13 · 533 阅读 · 0 评论 -
使用GIMP实现图片的背景透明
转自:http://www.hot-stamping.info/archives/105大家平时逛论坛,发博客都可以自定义头像,这时如果有一枚标新立异的头像往往更能引起别人的注意,所以我通常选择自己制作或改装个性的头像。在这个过程中发现,如果头像的背景是透明的,而不是通常的白色,视觉效果会更好。怎样才能使图片背景变透明呢?上网一搜,大多是使用PhotoShop操作的教程,为了完成这个小转载 2011-11-15 17:43:00 · 19609 阅读 · 0 评论 -
使用GIMP使图片背景透明化
转自:http://blog.csdn.net/sabalol/article/details/5711102使用GIMP使图片背景透明化 1. 打开图片。 2. 选gimp第一行,第五个图标(按颜色选择区域) 3. 选定背景区域 4. 选择-反转 5. 编辑-复制 6. 新建-填充类型设置转载 2012-05-12 12:10:23 · 2311 阅读 · 0 评论 -
谷歌发布世界上首个开源的HTML5 SIP客户端
转自:http://sd.csdn.net/a/20120521/2805721.htmlHTML5 SIP客户端是一款开源的,完全利用JavaScript编写的集社交(FaceBook,Twitter,Google+),在线游戏,电子商务等应用于一体。无扩展,无插件或是必备的网关,视频堆栈技术依赖于WebRTC。如同主页里的Demo视频演示,你可以轻松实现Chrome和IOS/And转载 2012-05-22 18:50:00 · 3238 阅读 · 0 评论 -
Red5性能测试
转自:http://www.pigg.co/red5-performance.html最近一直在做Red5的直播与视频开发,虽然Red5提供了与FMS趋同的功能,但对于Red5的性能我们一直不太清楚,如果想大规模使用Red5作为我们的生产服务器,那么还需要对它进行一些性能测试,以此来验证它是否能满足我们的需求.测试概要对Red5进行压力测试与性能测试,其中Red5版本为转载 2013-09-11 10:23:00 · 1927 阅读 · 1 评论 -
Red5流媒体服务器的安装与测试
转自:http://blog.csdn.net/youqishini/article/details/7960046转自:http://www.dianfusoft.com/Red5是一款基于Java的开源流媒体服务器,用它做服务器可以在Flex中实现像快播(Qvod)那样在线播放视频。Red5类似于tomcat,因此可以将red5与tomcat整合在一起.red5使用RTMP作为转载 2013-09-11 10:25:51 · 1462 阅读 · 0 评论 -
《Red5 用户参考手册》之十:Red5 核心技术第三章 自定义流路径
转自:http://blog.csdn.net/defonds/article/details/7776311官方最新《Red5 用户参考手册》全套下载地址 本文介绍了如何使应用流化或录制按需视频(VOD)到指定目录,而不是默认的 webapp 下的 streams 目录。 文件名生成器服务 Red5 使用一个叫做域服务的概念为一个特定的域转载 2013-09-29 22:13:36 · 1203 阅读 · 1 评论 -
如何在Android中解析AMF
转自:http://blog.csdn.net/visualcatsharp/article/details/6636960 AMF是Adobe捣鼓出来的一种开源的传输格式,用在多个地方,例如flash与后台传输,red5流媒体之类。在Adobe的BlazeDS服务器其实已经提供了如何解析AMF的代码,但由于耦合度有点高,因此有热心人士从BlazeDS服务器源代码中将解析AMF那一部分转载 2013-09-29 21:43:52 · 975 阅读 · 0 评论 -
RTMP协议研究
转自:http://blog.csdn.net/chenyanxu/article/details/4511087RTMP协议研究1协议研究概述 协议设计和分析一直都是在工作遇到,正好在这里总结一下,说到协议,在这个网络的时代,没有人可以离开它了。他存在我们生活中的任何角落,只不过我们平时,并没有注意到它的存在,可以这么说如果没有协议,我们生活和日常的工作生产都不能转载 2013-09-15 17:24:45 · 820 阅读 · 0 评论 -
实时视频在网页直播--windows下编译librtmp、rtmpdump
转自:http://zhaostudy2.blog.163.com/blog/static/1353502052011182538414/这段时间做实时视频的网页直播遇到了很多困难。 开始时,迫于项目时间的压力,觉得没有足够的时间学习和分析如何将实时视频发送到RTMP流媒体服务器作为实时流,只好使用最粗糙的做法是:先把获取到的实时视频以RTP包的形式 发送给本机,然后本机转载 2013-09-15 17:28:23 · 2413 阅读 · 1 评论 -
Red5的丢包处理
转自:http://olylakers.iteye.com/blog/1020390在多媒体应用中,针对Client端的带宽情况,Server端对Video Data要进行不同的处理,当Client带宽比较差时,需要在Server端对不同的视频帧进行是丢弃处理,如在低带宽条件下,对于非关键帧,为了更好的用户体验性和播放的平滑性,可对其进行丢弃,而关键帧,则一般不给予丢弃。下面结合代转载 2013-09-30 18:11:25 · 1334 阅读 · 0 评论 -
使用librtmp库发布直播流
转自:http://blog.163.com/zhujiatc@126/blog/static/183463820132135378895/rtmp协议与flv封包格式基本相同(本来就是一家公司的嘛)将flv文件解析出类型,时间戳,数据大小,数据区对应写的rtmp包的位置进行发送即可rtmpdump官网:http://rtmpdump.mplayer原创 2013-09-17 12:03:29 · 2151 阅读 · 0 评论 -
各种音视频编解码学习详解(2)--codec类型
转自:http://blog.csdn.net/simongyley/article/details/8454268资料(港台将information翻译为资料)压缩是透过去除资料中的冗余资讯而达成。就视讯资料而言,资料中的冗余资讯可以分成四类:时间上的冗余资讯(temporal redundancy) 在视讯资料中,相邻的帧(frame)与帧之间通常有很强的关连性,这样转载 2013-09-19 22:17:56 · 968 阅读 · 0 评论 -
采集音频和摄像头视频并实时H264编码及AAC编码
转自:http://www.cnblogs.com/haibindev/archive/2011/11/10/2244442.html0. 前言 我在前两篇文章中写了DirectShow捕获音视频然后生成avi,再进行264编码的方法。那种方法有一些局限性,不适合实时性质的应用,如:视频会议、视频聊天、视频监控等。本文所使用的技术,适用于这种实时性的应用,通过处理采集出来的音转载 2013-09-19 22:19:41 · 1138 阅读 · 0 评论