D01- 人脸处理领域的基本论述(第一次人脸领域知识巡礼)

目录

人脸处理领域是什么?

人脸如何在计算机中表示?

人脸处理领域的基本任务

人脸处理领域的基本流程

后文

关于本系列文章的相关声明

创作声明

费曼学习法声明

巡礼声明

版权声明

AI使用声明

参考文献声明


本文章创作时遵守若干开源协议及其声明,详情请见最底下”关于本系列文章的相关声明“一项。

人脸处理领域是什么?

人脸处理领域是一个涵盖计算机视觉、机器学习和人工智能等多个学科的交叉领域,主要研究人脸图像的分析、处理和理解。

人脸处理领域可以分为两大类:分类与编辑。

分类指一切对目标数据执行标记的行为,例如人脸识别,人脸检测,人脸对齐,人脸关键点检测,等等。

编辑指一切对目标数据(可能不存在)执行修改的行为,例如人脸生成,人脸编辑,人脸老化,人脸融合,等等。

说大白话(初中生能听懂的那种):

人脸处理领域,就是在人脸照片上搞事情,要么是玩连连看(分类),要么是画画(编辑)。

不理解?举个栗子,人脸检测,本质上就是确定图片上人脸的数量位置

结合上面我们对”分类“的不恰当定义,

确定人脸的数量,是在对图像打”数量:XXX“的标签。

确认人脸的位置,是在对图像打”位置:”左上角在XXX,右下角在XXX“的表情。

其他同理。

编辑一个样,本质就是在画画,给你一张人脸,参考给定的人脸(人脸生成)或者直接在上面画画(人脸编辑),看孩子画对应的老头(人脸老化),看哭脸画对应的笑脸(人脸表情编辑)。

其他同理.

人脸如何在计算机中表示?

  1. 人脸数据在计算机中的表示一般体现为多维张量形式

  2. 具体来说,大多数的任务使用3维张量(图像)的形式在计算机中表示。

  3. 对于人脸三维重建类任务,人脸数据一般使用点云的形式在计算机中表示。

图像:图像是二维空间的一组点,每个点有一个像素值3元组(R, G, B)(有的时候是四元组(+透明度))与两个坐标值(x,y)。

点云:点云是一种由三维空间中的一组点组成的模型。每个点包含三个坐标值 (x, y, z),代表该点在三维空间中的位置。点云可以有效地表示人脸的形状和结构,但无法捕捉人脸的纹理信息。

说大白话(初中生能听懂的那种):

人脸在计算机中,无非就是一张图片或者一个“雕塑”。

雕塑是立体的,给用户看的时候有3D酷炫感,对应的编辑操作类似于捏脸。

照片是二维的,但是架不住这货结构比雕塑简单容易传播呀,对应的编辑操作类似于画画。

再谈谈这俩货在计算机中的样子:

照片是二维的玩意,需要表示的就是色彩(啥颜色)与位置(在哪里是啥颜色?)

雕塑是三维的玩意,需要表示的除了色彩(啥颜色)与位置(在哪里是啥颜色?),还可能有其他各种东西(巴拉巴拉)

这里下一个暴论:一切计算机的表示都可以用数字或者一堆数字来解决(不证明,好奇自查),类似于你的学号/身份证号。如果一堆数字不够打标记,那就两堆三堆。

第二个暴论:一切颜色等于红色+绿色+蓝色的不同比例混合。

根据上面的暴论,表示照片,我们用(R:0-255,G:0-255,B:0-255)(总计三个数字)来表示一个颜色,其中RGB分别代表红色,绿色,蓝色。如果我想要那种透明感?安排!加一个0-255,变成一个(四个数字)(R:0-255,G:0-255,B:0-255,A:0-255)完事了。

同时,坐标好搞,如果照片就是个长方形,给个长与宽。

如果雕塑就是三维的,看成长方体,给个长宽高。然后根据要求追加各种数字。

所以,一个坐标对应一个颜色,称为像素(不严谨),一堆像素堆起来,就是一个图片/雕塑。

我们称雕塑为“点云”,由于图像与点云本质上都是一堆像素,我们称用于装载一堆像素的玩意儿叫矩阵(张量/向量.....一堆名字,对应计算机,物理,数学等领域的各种东西)。

人脸处理领域的基本任务

上面提到了:分类编辑

分类指一切对目标数据执行标记的行为,例如人脸识别,人脸检测,人脸对齐,人脸关键点检测,等等。

编辑指一切对目标数据(可能不存在)执行修改的行为,例如人脸生成,人脸编辑,人脸老化,人脸融合,等等。

说大白话(初中生能听懂的那种):

分类领域中,找数量+位置的叫人脸检测;打个标签说这是张三的叫人脸识别;把人脸的眉毛那些的数量+位置找出来叫关键点检测......这些我们在后面(估计是在H01左右)来谈。

编辑领域中,凭空搞个人脸叫人脸生成,把别人搞成无面人,然后贴个人脸上去的叫人脸对齐/人脸融合/换脸,把哭脸改笑脸叫人脸编辑......这些我们在后面(估计是在H01左右)来谈。

人脸处理领域的基本流程

人脸处理领域的基本流程遵循机器学习领域的基本流程。

即数据搜索,数据清洗,数据探索性分析—特征工程循环,模型构建,模型训练,模型评估等步骤。

说大白话(初中生能听懂的那种):

前面提到,人脸在计算机中就是一堆叫做“张量”的数字。

数据搜索:就是自己拍或者找一堆数据,放到计算机里面变成张量。

数据清洗:把拍的不好的数据搞掉,同时该打美颜的打美颜,该调亮度的挑亮度,图像的尺寸调整等等。

数据探索性分析—特征工程循环:给数据贴上一堆标签,然后看看怎么让数据变得更好。重复该步骤若干次直到你认为ok。

模型训练:模型(直接理解成就行了,但是比人傻亿点)。将上面处理好的东西喂给模型,模型会根据任务行动(分类/编辑),如果行动有误:

铜人该罚.png

如果行动无误:

铜人:你过关——!(震声)

(一阵欢快的BGM响起,雍正起身。)

雍正:多谢师叔!

模型评估:若干次后(是的,模型比弟子抗罚),让模型看之前没看过的东西,进行行动。

根据行动的正确情况判断模型的学习效果。

(如果要多次测评呢?)

对模型使用大记忆恢复(消失)术(A级记忆消除(物理))即可。(直接从数据权重上,抹掉模型的记忆即可)

model.eval():你就不能让模型直接不记忆不就行了吗?(你无需知道这是什么.jpg)

后文

D01到这里结束了。

下文:D02,将介绍人脸领域术式的基本沿革。

(人话:之前用什么,现在用什么)

希望能够对您有所帮助,我是觉之瞳,我们下期再见。

关于本系列文章的相关声明

创作声明

本系列的内容创作分为如下三个部分:

  1. 个人阅读文档之后的理解

  2. 对原文档的部分翻译

  3. 无关紧要部分的AI辅助创作

  4. 部分相关信息的引用及二次创作

本系列的图片来自于:

  1. PPT图形制作

  2. 幕布思维导图工具

  3. AI绘画辅助创作

  4. 网络(如侵权,请联系作者删除)

在此向人类艺术家与一切内容创作者,AI科学家与工程师,程序员团体致以最崇高的敬意。

费曼学习法声明

费曼学习法(Feynman Technique)是一种通过将所学知识用简单明了的语言解释给别人听来加深自己的理解和记忆的学习方法。这种方法最初由物理学家理查德·费曼(Richard Feynman)提出。 费曼学习法的基本思想是:将所学知识用自己的语言表达出来,以便理解、记忆和应用。

本文通过边学边创作的方式,将所学知识用简单明了的语言解释给大家,以加深自己的理解和记忆。由于个人理解的局限性,创作内容可能存在错误,欢迎各位专家批评指正。

巡礼声明

本文为”第一次人脸领域知识巡礼“的相关文章。

巡礼是宗教或灵性生活寻觅灵性意义的过程,通常是到一处圣地或者是对某人信仰有重要意义的地方。

在巡礼过程中,对应的概念体系会得到加强,从而能够在道路上达到更高的水准。

巡礼是周期性举行的,一旦有时间我(作者)就会执行下次巡礼,以做到知识的及时更新。

换而言之,您可以记住或者关注这个作者,以实时获取您感兴趣的资讯。

版权声明

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议

转载请附上原文出处链接和本声明。

转载请附上原文出处链接和本声明。

转载请附上原文出处链接和本声明。

AI使用声明

为加速创作与巡礼流程,本文在攥写过程中在无关紧要的过渡段与部分图像使用了AI生成技术。

参考文献声明

在此向人类艺术家与一切内容创作者,AI科学家与工程师,程序员团体致以最崇高的敬意。

注:

直接复制:直接复制生成的文案到内容中

知识参考:生成出来用来补充知识,写还是人写的。

本文在创作过程中受到了下面文章的启发:

  1. 人脸处理领域是什么?

    1. 【技术综述】简介计算机视觉人脸图像的十几个大的应用方向,我们都可以学什么 - 知乎

    2. Gemini-1相关生成文案(直接复制)

  2. 人脸数据在计算机中如何表示?

    1. Gemini-1相关生成文案(知识参考)

    2. Gemini-1相关生成文案(直接复制)

  3. 人脸处理领域的基本任务

  4. 人脸处理领域的基本流程

    1. 该罚 - 萌娘百科 万物皆可萌的百科全书

  5. 后文

    1. https://www.taobao.com/list/item/671017189432.htm

  6. 首图

    1. https://picx.zhimg.com/v2-d9ddb343dc9022312784b5df5c6787c7_720w.jpg?source=172ae18b

如有侵权烦请联系作者。

  • 29
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值