D01- 人脸处理领域的基本论述（第一次人脸领域知识巡礼）

搞知识的觉之瞳

已于 2024-05-18 18:08:44 修改

阅读量797

点赞数 29

分类专栏：第一次人脸领域巡礼文章标签：人工智能学习笔记计算机视觉

于 2024-05-18 15:54:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/unrealnum_border/article/details/139026850

版权

第一次人脸领域巡礼专栏收录该内容

1 篇文章 0 订阅

订阅专栏

目录

人脸处理领域是什么？

人脸如何在计算机中表示？

人脸处理领域的基本任务

人脸处理领域的基本流程

关于本系列文章的相关声明

费曼学习法声明

参考文献声明

本文章创作时遵守若干开源协议及其声明，详情请见最底下”关于本系列文章的相关声明“一项。

人脸处理领域是什么？

人脸处理领域是一个涵盖计算机视觉、机器学习和人工智能等多个学科的交叉领域，主要研究人脸图像的分析、处理和理解。

人脸处理领域可以分为两大类：分类与编辑。

分类指一切对目标数据执行标记的行为，例如人脸识别，人脸检测，人脸对齐，人脸关键点检测，等等。

编辑指一切对目标数据（可能不存在）执行修改的行为，例如人脸生成，人脸编辑，人脸老化，人脸融合，等等。

说大白话（初中生能听懂的那种）：

人脸处理领域，就是在人脸照片上搞事情，要么是玩连连看（分类），要么是画画（编辑）。

不理解？举个栗子，人脸检测，本质上就是确定图片上人脸的数量与位置。

结合上面我们对”分类“的不恰当定义，

确定人脸的数量，是在对图像打”数量：XXX“的标签。

确认人脸的位置，是在对图像打”位置：”左上角在XXX，右下角在XXX“的表情。

其他同理。

编辑一个样，本质就是在画画，给你一张人脸，参考给定的人脸（人脸生成）或者直接在上面画画（人脸编辑），看孩子画对应的老头（人脸老化），看哭脸画对应的笑脸（人脸表情编辑）。

其他同理.

人脸如何在计算机中表示？

人脸数据在计算机中的表示一般体现为多维张量形式
具体来说，大多数的任务使用3维张量（图像）的形式在计算机中表示。
对于人脸三维重建类任务，人脸数据一般使用点云的形式在计算机中表示。

图像：图像是二维空间的一组点，每个点有一个像素值3元组（R, G, B）（有的时候是四元组（+透明度））与两个坐标值（x，y）。

点云：点云是一种由三维空间中的一组点组成的模型。每个点包含三个坐标值 (x, y, z)，代表该点在三维空间中的位置。点云可以有效地表示人脸的形状和结构，但无法捕捉人脸的纹理信息。

说大白话（初中生能听懂的那种）：

人脸在计算机中，无非就是一张图片或者一个“雕塑”。

雕塑是立体的，给用户看的时候有3D酷炫感，对应的编辑操作类似于捏脸。

照片是二维的，但是架不住这货结构比雕塑简单容易传播呀，对应的编辑操作类似于画画。

再谈谈这俩货在计算机中的样子：

照片是二维的玩意，需要表示的就是色彩（啥颜色）与位置（在哪里是啥颜色？）

雕塑是三维的玩意，需要表示的除了色彩（啥颜色）与位置（在哪里是啥颜色？），还可能有其他各种东西（巴拉巴拉）

这里下一个暴论：一切计算机的表示都可以用数字或者一堆数字来解决（不证明，好奇自查），类似于你的学号/身份证号。如果一堆数字不够打标记，那就两堆三堆。

第二个暴论：一切颜色等于红色+绿色+蓝色的不同比例混合。

根据上面的暴论，表示照片，我们用（R：0-255，G：0-255，B：0-255）（总计三个数字）来表示一个颜色，其中RGB分别代表红色，绿色，蓝色。如果我想要那种透明感？安排！加一个0-255，变成一个（四个数字）（R：0-255，G：0-255，B：0-255，A：0-255）完事了。

同时，坐标好搞，如果照片就是个长方形，给个长与宽。

如果雕塑就是三维的，看成长方体，给个长宽高。然后根据要求追加各种数字。

所以，一个坐标对应一个颜色，称为像素（不严谨），一堆像素堆起来，就是一个图片/雕塑。

我们称雕塑为“点云”，由于图像与点云本质上都是一堆像素，我们称用于装载一堆像素的玩意儿叫矩阵（张量/向量.....一堆名字，对应计算机，物理，数学等领域的各种东西）。

人脸处理领域的基本任务

上面提到了：分类与编辑。

分类指一切对目标数据执行标记的行为，例如人脸识别，人脸检测，人脸对齐，人脸关键点检测，等等。

编辑指一切对目标数据（可能不存在）执行修改的行为，例如人脸生成，人脸编辑，人脸老化，人脸融合，等等。

说大白话（初中生能听懂的那种）：

分类领域中，找数量+位置的叫人脸检测；打个标签说这是张三的叫人脸识别；把人脸的眉毛那些的数量+位置找出来叫关键点检测......这些我们在后面（估计是在H01左右）来谈。

编辑领域中，凭空搞个人脸叫人脸生成，把别人搞成无面人，然后贴个人脸上去的叫人脸对齐/人脸融合/换脸，把哭脸改笑脸叫人脸编辑......这些我们在后面（估计是在H01左右）来谈。

人脸处理领域的基本流程

人脸处理领域的基本流程遵循机器学习领域的基本流程。

即数据搜索，数据清洗，数据探索性分析—特征工程循环，模型构建，模型训练，模型评估等步骤。

说大白话（初中生能听懂的那种）：

前面提到，人脸在计算机中就是一堆叫做“张量”的数字。

数据搜索：就是自己拍或者找一堆数据，放到计算机里面变成张量。

数据清洗：把拍的不好的数据搞掉，同时该打美颜的打美颜，该调亮度的挑亮度，图像的尺寸调整等等。

数据探索性分析—特征工程循环：给数据贴上一堆标签，然后看看怎么让数据变得更好。重复该步骤若干次直到你认为ok。

模型训练：模型（直接理解成人就行了，但是比人傻亿点）。将上面处理好的东西喂给模型，模型会根据任务行动（分类/编辑），如果行动有误：

铜人该罚.png

如果行动无误：

铜人：你过关——！（震声）

（一阵欢快的BGM响起，雍正起身。）

雍正：多谢师叔！

模型评估：若干次后（是的，模型比弟子抗罚），让模型看之前没看过的东西，进行行动。

根据行动的正确情况判断模型的学习效果。

（如果要多次测评呢？）

对模型使用大记忆恢复（消失）术（A级记忆消除（物理））即可。（直接从数据权重上，抹掉模型的记忆即可）

model.eval()：你就不能让模型直接不记忆不就行了吗？（你无需知道这是什么.jpg）

后文

D01到这里结束了。

下文：D02，将介绍人脸领域术式的基本沿革。

（人话：之前用什么，现在用什么）

希望能够对您有所帮助，我是觉之瞳，我们下期再见。

关于本系列文章的相关声明

创作声明

本系列的内容创作分为如下三个部分：

个人阅读文档之后的理解
对原文档的部分翻译
无关紧要部分的AI辅助创作
部分相关信息的引用及二次创作

本系列的图片来自于：

PPT图形制作
幕布思维导图工具
AI绘画辅助创作
网络（如侵权，请联系作者删除）

在此向人类艺术家与一切内容创作者，AI科学家与工程师，程序员团体致以最崇高的敬意。

费曼学习法声明

费曼学习法（Feynman Technique）是一种通过将所学知识用简单明了的语言解释给别人听来加深自己的理解和记忆的学习方法。这种方法最初由物理学家理查德·费曼（Richard Feynman）提出。费曼学习法的基本思想是：将所学知识用自己的语言表达出来，以便理解、记忆和应用。

本文通过边学边创作的方式，将所学知识用简单明了的语言解释给大家，以加深自己的理解和记忆。由于个人理解的局限性，创作内容可能存在错误，欢迎各位专家批评指正。

巡礼声明

本文为”第一次人脸领域知识巡礼“的相关文章。

巡礼是宗教或灵性生活寻觅灵性意义的过程，通常是到一处圣地或者是对某人信仰有重要意义的地方。

在巡礼过程中，对应的概念体系会得到加强，从而能够在道路上达到更高的水准。

巡礼是周期性举行的，一旦有时间我（作者）就会执行下次巡礼，以做到知识的及时更新。

换而言之，您可以记住或者关注这个作者，以实时获取您感兴趣的资讯。

版权声明

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议

转载请附上原文出处链接和本声明。

转载请附上原文出处链接和本声明。

转载请附上原文出处链接和本声明。

AI使用声明

为加速创作与巡礼流程，本文在攥写过程中在无关紧要的过渡段与部分图像使用了AI生成技术。

参考文献声明

在此向人类艺术家与一切内容创作者，AI科学家与工程师，程序员团体致以最崇高的敬意。

注：

直接复制：直接复制生成的文案到内容中

知识参考：生成出来用来补充知识，写还是人写的。

本文在创作过程中受到了下面文章的启发：

人脸处理领域是什么？
1. 【技术综述】简介计算机视觉人脸图像的十几个大的应用方向，我们都可以学什么 - 知乎
2. Gemini-1相关生成文案（直接复制）
人脸数据在计算机中如何表示？
1. Gemini-1相关生成文案（知识参考）
2. Gemini-1相关生成文案（直接复制）
人脸处理领域的基本任务
人脸处理领域的基本流程
1. 该罚 - 萌娘百科万物皆可萌的百科全书
后文
1. https://www.taobao.com/list/item/671017189432.htm
首图
1. https://picx.zhimg.com/v2-d9ddb343dc9022312784b5df5c6787c7_720w.jpg?source=172ae18b

如有侵权烦请联系作者。

搞知识的觉之瞳

关注

29
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
D01- 人脸处理领域的基本论述（第一次人脸领域知识巡礼）

人脸处理领域的基本论述
复制链接

扫一扫

专栏目录

搞知识的觉之瞳 CSDN认证博客专家 CSDN认证企业博客

码龄3年

22: 原创

131万+: 周排名

7万+: 总排名

2万+: 访问

: 等级

327: 积分

70: 粉丝

89: 获赞

9: 评论

106: 收藏

私信

关注

热门文章

分类专栏

最新评论

觉之瞳专题：PyTorch API接口综述（v1.0解析方法）
2301_78360299: 嘉登点了个赞👍
python能够干什么？
CSDN-Ada助手: 恭喜您撰写了第11篇博客！标题“python能够干什么？”非常吸引人。您对Python的研究和分享让我们对它的应用范围有了更深入的了解。希望您能继续保持这种创作热情，并继续分享您对Python的见解和经验。如果可以，我想建议您在下一篇博客中可以探讨Python在数据分析或人工智能领域的应用，这些是当前非常热门和有趣的领域，相信您的观点会给读者带来新的启发。再次恭喜您，期待您的下一篇作品！
知识速记：软件工程中的版本
CSDN-Ada助手: 恭喜用户写了第12篇博客！标题中的“知识速记：软件工程中的版本”引起了我的兴趣。我很高兴看到您持续创作，分享关于软件工程的知识。尤其是在版本控制方面，这是一个非常重要的主题。我希望您能继续深入探讨不同版本管理工具的优势和缺点，以及在不同项目中选择正确版本控制策略的原则。这将为读者提供更多实用的知识和指导。期待您下一步的创作！
面向对象寻迹（1）：关于类机制的概述与探究
CSDN-Ada助手: 恭喜您写下了第10篇博客，题目很有吸引力，内容也很精彩，让人对面向对象的类机制有了更深入的认识。希望您能继续保持创作的热情，为我们带来更多有价值的知识。下一步，建议您可以从更深入的角度探究类机制，例如类的继承、多态等方面。期待您的下一篇博客。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
【AI浅谈】AI算法，用尽可能简单的话讲懂AI的原理【1】
起床气233: 讲得真的是通俗易懂，支持一下

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。