网上资源还是很多的,下载了中文版和英文版一起看,先看英文版留个印象,再看中文版加深印象(纠正错误理解)
计算机视觉:模型、学习和推理
概述:
本书是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的联系,以及如何研究这些联系来从新的图像数据中作出新的推理。本书要求少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也非常有用。
作者简介:
Simon J. D. Prince博士,伦敦大学学院计算机科学系高级讲师。他主讲的课程包括:计算机视觉、图像处理和高级数学方法。他有着计算机科学和生物学的专业背景,发表了多篇论文,涉及计算机视觉、生物测定学、心理学、生理学、医学影像、计算机图形学和人机交互。
根据目录,整体把握本书脉络。
第一部分 概率Probability
简介:随机概率 联合概率 互斥边缘化【marginalization】条件概率 贝叶斯公式 独立性 期望
概率分布:伯努利分布 贝塔分布 分类【categorical】分布 狄利克雷【dirichlet】分布 一元正态分布 正态逆伽玛分布
多元变量正态分布 正态逆维希特【wishart】分布 共轭性【conjugacy】
拟合合适概率模型:最大似然法【likelihood】 最大后验法【posteriori】 贝叶斯方法【approach】
示例:一元正态分布 分类分布
正态分布:协方差矩阵【convariance matrix】的种类 协方差分解【decomposition】变量线性【linear】转换 边缘分布
条件分布 两正态结合乘积【product】 变量变化
第二部分 机器视觉的机器学习
视觉中的学习和参考推理【referance】:计算机视觉问题 模型种类 示例1:回归【regression】
示例2:二值【binary】二进制 分类 我们应当用什么模型 应用
复杂数据密度【densities】建模:正态分类模型 隐藏变量 期望最大化最大期望 混合【mixture】高斯模型 t分布 因素分析
组合模型 最大化期望(算法)的细节 应用
回归模型:线性回归 贝叶斯线性回归 非线性回归 核以及核技巧 高斯过程回归 稀疏【sparse】线性回归 二元【dual】线性回归
相关relevance向量回归 多元数据回归 应用
分类模型:逻辑回归 贝叶斯逻辑回归 非线性逻辑回归 对偶【dual】逻辑回归 核逻辑回归 相关向量分类
增量incremental拟合和boosting启动 分类树
多分类逻辑回归 随机数,森林和蕨【ferns】 与非概率模型的关系 应用
第三部分 连接局部local本地模型
图模型:条件独立性 有向【directed】直接【derict】图模型 无向【undirected】图模型 比较以上两种图模型
计算机视觉中的图模型 含有多个未知量【unknows】模型的推理【inference】 样本采样【drawing simples】 学习
链式【chains】和树模型:链式模型 链式MAP推理 树的MAP推理 链式边缘后验推理 树的边缘后验推理 链式和树式模型学习
超越链式和树式之外的东西 应用
网格【grids】模型:马尔科夫【markov】随机域场 二值成对【pairwise】马尔科夫随机场MAP推理
多标签成对MRF的MAP推理 非凸势【non-convex potentials】多标签MRF 条件随机场 更高阶的模型
有向网格模型 应用
第四部分 预处理
图像预处理和特征提取:逐像素转换 边缘、角点【corners】和兴趣点 描述
维度【dimensionality】减少
第五部分 几何【geometry】模型
针孔【pinhole】相机: 简介 三个几何问题 齐次坐标【homogeneous cooridinates】 学习外在参数
学习内在参数 推理3D世界点 应用
变换模型:2D变换模型 学习变换模型 推理变换模型 三个平面几何问题 图像间变换 变换的鲁棒【robust】学习 应用
多个【multiple】摄像机系统:双视图几何学理论两个视角几何 实【essential】矩阵【matrix】 基础【fundamental】矩阵
双视图重构的流程【pipeline】 校正【rectification】 多视图重构 应用
第六部分 视觉模型
形状模型:形状和其表示 蛇snake模型 形状模版【templates】 统计形状模型 子空间形状模型 三维形状模型
形状和外观的统计模型 非高斯统计形状模型 铰接式articulated模型 应用
样式方式style和身份模型:子空间身份模型 概率线性判别【discriminant】分析 非线性身份模型
非对称【asymmetric】双线性模型 对称双线性和多线性模型
时序【temporal】模型: 时序估计框架 卡尔曼滤波器过滤器 扩展卡尔曼滤波器 无损【unscented】卡尔曼滤波器
粒子【particle】滤波器
视觉词模型:视觉词集合的图像图像作为视觉词集 词包 隐【latent】狄利克里分配分布【allocation】 单个创作作者主题模型
星座【constellation】模型 场景模型
第七部分 附录
符号集说明【notation】
最优化【optimization】 问题表述 选择一个研究方向 线性调查 重新参数化【reparameterization】
线性几何: 向量 矩阵 张量 线性变换 奇异【singular】值分解 矩阵微积分学【calculus 】
常见【common】问题 大型矩阵求逆的技巧
在前沿部分介绍了作者对计算机视觉问题的理解: