信息隐藏技术笔记

持续更新中
二、信息论基础知识
2.1 信息与信源统计模型
2.1.1信息的基本属性和Shannon信息概念
1、信息的“基本属性”是“随机性”
2、Shannon将信息定义为"用来消除不确定性的东西"
3、信息的度量:应当与符号的不确定性有关
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2.1.2熵函数及其性质
在这里插入图片描述
在这里插入图片描述
熵函数的基本性质
1、对称性
熵:只与信源符号的总体统计结构有关不取决于个别符号发生的概率。
表明:熵是关于信源总体特性的一种度量。
2、非负性
3、确定性
在这里插入图片描述
4、扩展性
在这里插入图片描述
5、可加性
统计独立信源X和Y的联合信源的熵等于分别熵之和
6、极值性
在这里插入图片描述
7、上凸性
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
2.1.3信源统计模型与信息冗余
信源输出–随机变量
信源的描述–统计模型
信源的分类
输出符号的统计特性–连续信源、离散信源、混合信源
随机变量的取值范围和概率分布特点–有记忆信源和无记忆信源
符号之间的统计关系进行划分–平稳信源和非平稳信源
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
实际信源:输出符号间有一定的依赖关系,多为有记忆信源
图像信源:灰度值在空间域某一领域内变化不大
音频信源:声音的强度在某段时间内变化不大
中文信源:使用的汉字前后有明显的依赖关系
信源输出的随机矢量:统计关系复杂,不同的时间、位置,统计关系可能不 同,输出…X1 X2 …Xi…为随机过程
平稳随机过程:统计特性不随时间起点的平移而改变否则是非平稳随机过程
在这里插入图片描述
在这里插入图片描述

信源输出信息量的大小:依赖于符号序列的统计特性。
实际信源:…X1 X2 … Xi… 随机过程
输出信息量:依赖于符号序列的统计特性
非平稳随机过程:统计关系与起点有关
平稳随机过程:统计关系与起点无关,统计分析比较简单
实际信源:足够长时间进入平稳状态,可以看作平稳信源
无记忆随机过程:符号之间无关联
有记忆随机过程:符号之间存在关联
实际信源:输出为有记忆随机过程 有记忆信源
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
由条件熵的性质知道:
符号间存在关联-》信源输出信息量减小
相关距离m愈长-》信源输出信息量愈小
结论:
1、经过足够长时间后,信源进入平稳状态,实际信源可看作 平稳m阶Markov信源
2、如果符号之间存在相关性,其随机性减小信源输出信息量小(m愈大,输出信息量愈小)

在这里插入图片描述
2.1.4信源编码
在这里插入图片描述
在这里插入图片描述
无失真信源编码:
信源符号(序列)《–》码符号序列 (译码不会产生失真)
在这里插入图片描述
限失真信源编码
在这里插入图片描述
在这里插入图片描述

以一定限度内的失真换取高压缩比,实现了更有效的数据压缩
基本原理:消除相关性,依据生理、心理特性引入失真进一步提高信源编码的有效性
应用:如数字图像编码 数字视频编码 数字音频编码
2.2 线性运算与变换

2.3 多媒体信息的数字化与压缩编码
2.4 数字媒体的质量评价
三、多媒体感知特性与编码
冗余:在某种媒体形式中普遍存在的不被人感知、不包含信息、按照特定规则附加或重复表达的多余成分。即感知冗余、信息冗余、结构冗余
信息隐藏:利用感知器官的感知冗余(不敏感性) 、数字媒体的数据(信息)冗余、媒体表示体制中的文件结构冗余 、以公开的数字媒体作为载体信号 对秘密消息进行编码、加密等处理后 将秘密消息隐藏于数字媒体(宿主对象)
常见的宿主对象(数字媒体)有: 数字图像、数字语音、数字视频 、文本、网页、软件等各类网络媒体文件
3.1 听觉特性与数字音频编码
3.1.1 听觉系统的生理、心理特性
声音信息三个要素:音调、音强和音色
声音信号(音频信号) :由一系列振幅不同、频率不同的 正弦波叠加而成 时间、幅度连续的模拟信号
模拟的音频信号 经 时间采样 和 幅度量化 成为 数字音频
按照音频信号的频率范围划分为:
语音(话音)信号:频率 300-3000Hz
亚音(次音)信号:频率小于 20Hz
超音频(超声波)信号:高于 20kHz
人的听觉系统对声音的感知:是一个 接收、选择、分析 和 判断 音调、响度 和 音色 的复杂过程
人对声音的感受 不仅决定于人的生理特性(生理声学) 也与心理特性(心理声学)有关
听 阈:响度减弱至刚可听见时的声音强度 反映人耳可感知的最低声音强度
痛 阈:使人耳有疼痛感时的声音强度 反映人耳可感知的最强声音强度
听阈 和 痛阈 的数值是随频率变化的
表 明 :
人耳对于声音的 响度(强度)和音高(频率)的主观感觉 不仅与它们的测量单位(声强、频率)有关 它们之间也具有互为补充的关系 人耳听觉范围很宽 声强相差1012倍以上
3.1.2 听觉感知冗余
差 阈: 分辨不同声音之间差别的感觉阈限 ,反映了人耳分辨不同强度、不同频率音频信号的能力
响度差阈 – 可分辨的最小强度差异
音高差阈 – 可分辨的最小音高差异
测量表明:人耳可分辨的音高约 1400 个 ,人耳可分辨的响度约 280 个
掩蔽效应:由于某个声音的存在 使人耳对其它声音的听觉灵敏度降低
表现形式:时域掩蔽 和 频域掩蔽
时域掩蔽 :在一个强声信号之前或之后弱声信号被进一步削弱或湮没的现象,强、弱声信号出现的时间差越小,时域掩蔽效应越显著
频域掩蔽: 两个频率相近的声音同时发出时较强的音将使较弱的音进一步减弱或完全湮没的现象弱音信号频率越接近强音信号频率频域掩蔽效应越显著
1、数字音频的频率、强度表示精度远高于人的听觉分辨能力
2、掩蔽效应使人耳的听阈提高,数字音频数据中存在明显的听觉冗余,利用数字音频中的听觉感知冗余(1)可修改低比特位数据,隐藏秘密消息 (2)可用于指导 秘密消息的嵌入策略 和 压缩编码中的量化策略
3.1.3 数字音频的信息冗余
信源存在信息冗余的原因:
(1)符号取值分布非均匀(非等概分布)
(2)符号序列中相邻数据存在相关性(Markov信源)
数字语音信源的信息冗余包括: 时间域冗余 和 频率域冗余
(1)时间域冗余
强度分布的非均匀性
样值间的相关性(Markov信源)
信号周期的相关性(可闻域瞬间只有部分频率成分 在起作用(特征频率) 特征频率以一定的周期反复出现具有相关关系)
长时自我相关性(在一个相对较长的时间间隔内数据序列的样值、周期相关性相对稳定)
静音(声音信息中的停顿间歇)
(2)频率域冗余
数字语音的功率谱分布存在的信息冗余
长时功率谱密度的非均匀性(数字音频的能量分布集中在低频部分,功率谱的分布非平坦)
语言特有的短时功率谱密度(语音在某些频率会出现峰值。基因频率决定语音特征,信息量较大)

3.1.4 数字音频的编码
经模数转换(采样、量化、编码)得到 PCM 格式的数字音频文件
只要时间采样率满足 Nyquest 率,样本的量化比特数足够多,解码恢复能够保持良好音质,不会损失信息
然 而:
数码率=采样率×量化比特×声道数
PCM 格式数字音频的数码率较高
压缩编码可以得到高效的数字音频数据
无压缩的音频数据格式(WAV,AIFF)
无损压缩的音频数据格式(FLAC,ALAC,WMA)‘
有损压缩的音频数据格式(MP3 数据量减少75%—90%,OGG,AAC,WMA)
3.2 视觉特性与数字图像编码
3.2.1 视觉系统的生理、心理特性
亮度:光源或反射面的明亮程度
光亮感觉的特点:
*主观亮度感觉是心理量而不是物理量
*主观亮度感觉与亮度值 B 的对数成比例
*主观亮度感觉与周围环境亮度有关
人眼感觉亮度不是简单的光强度函数
同时对比现象:
相同亮度刺激下,若背景亮度不同,人眼所感受到的主观亮度不同
马赫效应
明暗交接处,存在更暗和更亮的条带
 对比度
最大亮度Bmax 与 最小亮度Bmin 的比值人可感知的影像对比度不超过 100 : 1
人眼对物体亮度的感觉:
主要取决于图像的相对亮度变化只要保持物体 Bmax与 Bmin 的比值相同就能给人以真实的视觉感受
可辨别阈值:主观上刚可分辨的最小亮度差
对比灵敏度:不同亮度B下,能觉察的  Bmin 非定值
灰度层次:最大亮度和最小亮度之间的亮度级差数,反映图像质量的重要参数,图像常用256个灰度层次1Byte表示
可见度阈值:恰能被观察者发现的最小干扰值
邻近像素有较大的亮度变化时可见度阈值增加
边缘“掩盖”了邻近像素中的信号干扰这一现象称为“视觉掩盖效应”
此特性可用于指导量化失真的控制策略秘密消息嵌入位置与嵌入率选择
颜色视觉:7
3.2.2 视觉感知冗余和信息冗余
3.2.3 数字图像编码与数据格式
3.2.4 静止图像编码标准(JPEG)
四、信息隐藏原理与技术分类
五、数字隐写与隐写分析
六、数字水印

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值