图像、视频处理
文章平均质量分 61
基本cv操作
Robin_Pi
所有觉得难得东西,只是因为没有真正理解最基础的概念
展开
-
一文了解 Python 图像处理
文章目录1. 图像读取1.1 二进制读取1.2 数组读取2. 图像处理2.1 图像缩放2.2 图像裁剪2.3 像素级操作3. 完整代码1. 图像读取网上各种图像读取方法,我这里只根据目的划分为二进制和数组读取,两种方式——前者用于网络传输,后者用于广义上的图像处理。1.1 二进制读取使用ope() 以及 read()即可,其中使用'rb'指定以二进制的方式读取,用read而不是readline或者readlines,是读取全部的数据。with open(data_path, 'rb') as f:原创 2021-08-28 07:13:07 · 447 阅读 · 0 评论 -
屏幕分辨率:聊一聊像素
分辨率和像素分辨率(Resolution):(屏幕)像素点的个数一般用宽高比横向像素x竖向像素的方式来表达像素,比如电脑、电视、手机。注意的是手机像素(比如1080x720)实际上表达的是手机横放时候的分辨率,而我们一般使用的时候是把手机竖着的。像素(Pixel):组成数字图像的基本单元(px),也就是一个小格子常见分辨率常见分辨率:常见的分辨率为4:3,或者16:9,即640x480和1280x7204 :3人单个眼睛左右有160度的视野范围,上下有120度的视野范围。而现在最原创 2021-06-08 10:54:56 · 1997 阅读 · 0 评论 -
Python音频处理:创建一个正弦波并保存为wav文件
Python音频处理:创建一个正弦波并保存为wav文件0. 预备知识0.1 数字信号基础0.2 声学概念基础1. 创建一个正弦波2. 保存为wav文件0. 预备知识0.1 数字信号基础0.2 声学概念基础1. 创建一个正弦波正弦波公式:y(t)= A * sin(2 * pi * f *t)变量声明import numpy as np import wave import struct import matplotlib.pyplot as plt # freque原创 2021-01-05 13:53:31 · 7287 阅读 · 5 评论 -
Python实现 PCM 和 WAV互转
参考:wav和pcm的转换(Python版本)原创 2021-01-04 10:43:20 · 2424 阅读 · 0 评论 -
通过PCM再理解音频信号基础
PCMPCM基础*什么是PCM?*PCM 数据储存*用什么量来描述PCM?**PCM数据流是什么样?*WAV与PCM的区别其它PCM基础什么是PCM?脉冲编码调制( Pulse Code Modulation , PCM) 是模拟信号以固定的采样频率转换成数字信号后的表现形式。pcm文件没有头部信息,全部是采样量化后的未压缩音频数据。PCM 数据储存用什么量来描述PCM?Sample Rate 采样率8kHz(电话)、44.1kHz(CD)、48kHz(DVD),16kHz 因为保留了原创 2020-12-31 13:47:55 · 2188 阅读 · 0 评论 -
音频特征(2):时域图
文章目录参考:使用wavread读取一段音频后怎么画出横坐标是时间的波形图原创 2020-11-12 15:00:38 · 9103 阅读 · 0 评论 -
“声音”背后的原理(3):音频信号处理的基础概念和流程小结
从音频信号到特征帧的处理流程:音频信号|采样与量化|分帧|加窗|特征提取|帧叠加与帧采样音频信号的特征一般分为时域特征和频域特征两大类,目前大部分实用系统都采用频域特征。特征:(傅里叶变换)|频域幅值特征|(进一步处理)|PLP或者MFCC梅尔倒谱系数(MFCC) 是语音领域最常用的特征。...原创 2020-11-11 18:00:04 · 3593 阅读 · 0 评论 -
Python 音频处理:wave
wave 模块提供了一个处理 WAV 声音格式的便利接口。它不支持压缩/解压,但是支持单声道/立体声。用法:wave.open(file, mode=None),mode为rb:生成 wav_read 对象wb:生成 wav_write 对象注意不支持同时读写。注:关于 r、w、rb、wbr和w是普通读和写文件(简单理解为人工编写的文件);rb和wb是读写二进制文件(简单理解为可以操作图片等非手工编写的文件)(1)Wave_read对象(2)Wave_write 对象...原创 2020-11-11 10:56:46 · 10984 阅读 · 0 评论 -
使用 Python 做音频处理·总章(持续更新)
pydub 功能比较强大,留以备用# -*- coding: utf-8 -*-# @Author : FELIX# @Date : 2018/5/18 15:13from pydub import AudioSegmentsound=AudioSegment.from_file("aaa.mp3","mp3")sound2=AudioSegment.from_file('bbb.mp3','mp3')# 把一个多声道音频分解成两个单声道# index[0]为左声道# inde原创 2020-11-10 21:22:42 · 6975 阅读 · 0 评论 -
音频特征(2):时域图、频谱图、语谱图(时频谱图)
文章目录 时域和频域 1. 概述 2.(时域)波形和频域:用几张对比图来区分 2.1 时域和频域 2.2 区分:时频谱图(语谱图)原创 2020-10-21 17:37:07 · 82402 阅读 · 17 评论 -
Mac 在Python脚本中使用 ffmpeg
1. ffmpegFFmpeg is a collection of libraries and tools to process multimedia content such as audio, video, subtitles and related metadata.FFmpeg 是视频处理最常用的开源软件。它功能强大,用途广泛,大量用于视频网站和商业软件(比如 Youtube 和 iTunes),也是许多音频和视频格式的标准编码/解码实现。ffmpeg的官网地址:https://原创 2020-10-21 14:49:15 · 1342 阅读 · 0 评论 -
使用Python合并多个wav音频
合并两个文件import waveinfiles = ["sound_1.wav", "sound_2.wav"]outfile = "sounds.wav"data= []for infile in infiles: w = wave.open(infile, 'rb') data.append( [w.getparams(), w.readframes(w.getnframes())] ) w.close()output = wave.open(outfile,原创 2020-08-17 18:55:03 · 9010 阅读 · 5 评论 -
最简教程:使用Python和opencv库绘制矩形框
话不多说,直接上代码:img1 = cv2.imread("xxx/face.jpg") # # ...cv2.rectangle(img1,(x1, y1), (x2, y2), (0, 0, 255), 2)cv2.imshow('face', img1)cv2.waitKey(0) # 让用户按下键盘任意一个键来退出此图片显示窗口(若没有图像会闪退)重点是cv2.rectangle的参数理解:首先 img1 表示用OpenCV读取进来的图片然后(x1, y1)和(x2, y2原创 2020-08-07 15:13:18 · 2237 阅读 · 0 评论 -
python 图像处理——图像读取方法总结
Python各类图像库的图片读写方式总结原创 2020-03-17 11:45:18 · 304 阅读 · 0 评论 -
Python [plt 和 cv] 图片读取、显示和保存
绘制图像1. 图片读取方式2. 绘图2.1 图片显示2.2 关闭坐标显示3. 保存图片1. 图片读取方式keras 导入opencv 导入2. 绘图2.1 图片显示opencv 绘制 (默认 gbr)cv2.imshow()若不能正常显示:k = cv2.waitKey(0) # 0==wait foreverplt 显示plt.imshow()plt.sh...原创 2020-03-28 09:01:50 · 4150 阅读 · 0 评论 -
技术备用
未来可能用到的技术:FFmpeg 视频处理入门教程原创 2020-08-06 11:10:01 · 116 阅读 · 0 评论