2024年2023 Google开发者大会:你了解机器学习的新动向吗?(2),2024年最新食堂大妈看完都学会了

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

(

x

,

y

^

)

P\left( \boldsymbol{x},\hat{y} \right)

P(x,y^​)建模求得数据各模式的决策边界。

在这里插入图片描述

机器学习模型的分类(绿色为新样本)

如图所示,判别式模型通过最优决策边界计算

P

(

y

^

x

)

P\left( \hat{y}|\boldsymbol{x} \right)

P(y^​∣x),并选择使

P

(

y

^

x

)

P\left( \hat{y}|\boldsymbol{x} \right)

P(y^​∣x)较大的

y

^

\hat{y}

y^​作为

x

\boldsymbol{x}

x的预测值;生成式模型通过比较样本

x

\boldsymbol{x}

x与模型各模式间的相近程度,即通过联合概率间接计算样本

x

\boldsymbol{x}

x对各模式的后验概率,并选择使后验概率较大的

y

^

\hat{y}

y^​作为

x

\boldsymbol{x}

x的预测值

生成式模型和判别式模型是两种截然不同的人工智能模型。判别式模型的主要任务是对给定输入进行分类或标记,而生成式模型则是根据给定的条件生成新的数据。在过去,人们只希望基于已有的给定数据做一些预测和拟合,因此判别式模型得到发展并且很好地解决了大部分任务;而未来,人们将目标转向用生成式模型生成全新数据,进行迁移学习等,也就是常说的人工智能生成内容(AI Generated Content, AIGC)

在这里插入图片描述

为什么我们需要生成全新数据?

答案很简单:我们希望提高人工智能的工作上限,就不能仅仅依靠它对已有数据的拟合,而是像人一样有一定的创新能力。

生成式模型相比判别式模型的独特优势,使之可以应对更多的任务,例如推动内容开发、视觉艺术创作、数字孪生、自动编程,甚至为科学研究提供AI视角、Al直觉…因此生成式人工智能的未来发展趋势。

本次大会展示了非常多AIGC方面的demo,一个大家比较熟悉的例子是AI绘画,在这个互动演示中,Google展示了在Google Kubernetes Engine(GKE)上部署Stable Dffusion的强大能力和可扩展性。与会者将亲眼目睹在Stable Diffusion最受欢迎的Web界面上实时生成高质量图像的过程

在这里插入图片描述

2 无障碍游戏体验

Google的技术氛围是具有包容性和国际视野的,其产品往往会考虑不同人群的实际需要。举例而言,Google推出的**MST肤色量表(Monk Skin Tone Scale)**可以保证面部识别、目标检测等技术对不同肤色的人群不存在偏见。

在这里插入图片描述

另一个实例是通过面部识别技术为有障人士提供更好的游戏体验。本次大会上,Google Gameface联合《荒野行动》,将机器学习和传统编码相结合,以解决面部检测和面部地标提取的挑战,并将这些信息转化为鼠标遥测的代码。通过检测玩家的面部表情和动作,游戏可以更好地理解玩家的情感和动机,从而根据这些信息提供更个性化的游戏体验。包括自动调整游戏难度、创建更具互动性的游戏角色或者提供更逼真的虚拟现实体验。

在这里插入图片描述

对有障碍人士而言,他们可以利用面部动作来代替手部操作,从而参与游戏,表达自己的情感和意愿。这种互动性能够增强他们在游戏中的参与感和满足感,享受游戏的乐趣。同时,面部表情控制游戏可以帮助他们更好地表达自己的情感,与其他玩家或角色进行情感交流。这种交流方式能够增强社交互动,减少沟通障碍。

每个人的面部表情和动作都是独特的,能否将自己的个性特点融入游戏,游戏则根据面部表情来调整角色行为或反应,使游戏体验更加个性化和独特?期待Google未来在这方面的技术动向。

3 跨平台机器学习

GoogleMediaPipe是一款用于构建跨平台、基于机器学习的视觉与感知应用程序的机器学习模型框架。它可以帮助开发人员轻松地构建AI应用程序,如物体检测、姿势估计、虚拟试衣和手部跟踪等。作为一款跨平台框架,MediaPipe不仅可以被部署在服务器端,更可以在多个移动端 (安卓和苹果 iOS)和嵌入式平台(Google Coral和树莓派)中作为设备端机器学习推理框架。MediaPipe提供了一系列机器学习管道和计算单元,以处理多种不同类型的感知数据,例如视频、音频和深度图像数据。同时,它还提供了大量的预训练模型和工具,使开发者可以快速构建高质量的视觉应用程序,而不需要编写复杂的算法和代码。

在这里插入图片描述

除此之外,MediaPipe还为开发人员提供了模块化的流水线视图,以及可以自定义的机器学习管道和组件,这些功能可以帮助开发人员更好地理解和调试他们的应用程序。此外,在移动设备上部署应用程序时,MediaPipe还优化了硬件和软件的配合,以实现更快的性能和更低的功耗。

总的来说,MediaPipe是一个强大且易于使用的开源框架,它可以帮助开发者轻松构建各种不同类型的视觉应用程序,并且在跨平台和性能方面都有良好的表现。在Google,一系列重要产品,如YouTubeGoogle LensARCoreGoogle Home 等,都已深度整合了MediaPipe

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

1715594082714)]
[外链图片转存中…(img-8nfFZyLN-1715594082715)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

  • 14
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值