ocr中遇到的相关图像处理概念

  1. 仿射 affine 
    1. 平面内的内移,旋转,错切,缩放,变换后仍在一个平面
    2. 三个点
    3. 仿射变换:向量经过线性变换+平移
      1. \begin{bmatrix} x_1\\ y_1 \end{bmatrix}=\begin{bmatrix} \begin{matrix} a &b \end{matrix}\\ \begin{matrix} c &d \end{matrix}\\ \end{bmatrix} \begin{bmatrix} x_0\\ y_0\end{bmatrix} + \begin{bmatrix} b_x\\ b_y \end{bmatrix}
    4. 6个未知数,6个方程,1个点列2个方程,需要3个点坐标
  2. 投影 projective 
    1. 物体与投影面上的像之间的变换,变换前后不在一个平面
    2. 四个点
    3. \begin{bmatrix} x_1\\ y_1\\ 1 \end{bmatrix}=\begin{bmatrix} \begin{matrix} a &b &c \end{matrix}\\ \begin{matrix} d &e &f \end{matrix}\\ \begin{matrix} g &h &i \end{matrix} \end{bmatrix} \begin{bmatrix} x_0\\ y_0\\ z_0 \end{bmatrix} + \begin{bmatrix} b_x\\ b_y\\ b_z \end{bmatrix}
    4. 12个未知数,12个方程,1个点列3个方程,需要4个点坐标
  3. IOU
  4. 分类中的交叉熵
    1. \\ \sum -y_ilog(p_i) \\ log(1)=0 \\ log(0)=-infinite
  5. 字符串编辑距离(levenshtein距离)
    1. 计算两个字符串间的差异程度的字符串度量,可以认为是从字符串a修改到字符串b需要的单个字符编辑次数最小值
    2. eg:kitten --> sitting levenshtein=3
      1. k->s sitten
      2. e->i sittin
      3. _->g sitting
    3. 实现方法:动态规划
    4. https://blog.csdn.net/ls386239766/article/details/38961745
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值