简单易懂的深度学习知识!(1)

最近几年,深度学习在图片识别、语言处理上面应用广泛,有很多突破。就算没用过,多多少少也听过,特别是用于图像生成的Stable-Diffusion和问答助手ChatGPT更是名声大噪、天下震动。

去年很多大企业先后发布了语言模型,再加上售卖焦虑的媒体,人工智能一时风头无两。但仔细想想似乎每隔一年都有被爆炒的技术:微服务、中台、区块链、云原生、元宇宙。

OpenAI又新出了一个sora视频模型,通过提示词生成1分钟视频,看着效果很好。有可能只是把比较好的测试结果呈现出来,差的视频就没放出来了。但是人工智能发展日新月异,每天都有研究人员在做实验,实际应用生成视频也是早晚的事。

比尔盖茨:人们往往高估技术变革在3-5年内的影响,而低估技术变革在 10年甚至更长时间尺度上的影响。

既然人工智能将给社会带来剧变,有没有想过去学习其运行的原理?

说不定以后要接触人工智能的产品,提前掌握这方面的技能,也是快人一步啊。

而且学会深度学习后,自己做个模型,如果能在生活、工作中应用,对我们个人发展也会大有帮助。

总的来说,了解人工智能产品背后的深度学习知识、原理还是有好处的。

那么怎么去学习呢?要知道我们大多数人并不是从事这方面的研究,高等数学也不是很熟悉。一上来就看数学公式,估计会直接劝退。

作者将用通俗易懂的类比和实际的代码,让大家学懂弄通深度学习!

好了,现在开始学习。

神经网络

就像再复杂的软件是由一个个函数组成的一样,深度学习模型也是由一层层的神经网络组成,而神经网络又由大量的神经元组成的。看懂了神经网络,对于深度学习会有清晰、直观的认识。

图片

上面这张图片是一个神经元。

简单解释下每个步骤的作用,在神经网络中,神经元接收输入信号(Inputs),加权(Weights)后求和(Summation),再通过激活函数(Activation)输出结果(Output)。

抽象成公式:Y = f (Wx + b)。

简单的理解,所谓的训练模型就是解这个公式,求出W的值。问题来了,我们怎么知道W的值是正确的,看模型输出结果的正确率。

举个图像分类的栗子。彩色数字图像都是一个个像素组成的,分辨率10*10的图像有100个像素。每个像素的值在0-255之间,也就是R、G、B三种颜色的值,这些像素组成了一个三维矩阵。

【图像原理】rgb数字图片概念_32单片机图像像素点rgb计算算法通过什么实现-CSDN博客

计算机视觉 | 1. 一切的基础: 灰度图像(读取/转换/像素定位) - 知乎 (zhihu.com)

这个三维矩阵拉平后再变成一维数组,就是模型input的值。

如果水果图像分类模型把一张苹果的图片识别成西瓜,那很离谱,我们通过手动再调整参数,求出W的值,来让输出的Y的预测结果更准确。

调整哪些参数呢?后面多写几遍代码自然知道了。

循环这个调整参数的过程,叫做训练模型,直到得到满意的正确率后停止训练。

值得一提的是,每次训练后,会通过反向传播把参数更新到每层的神经元w。如果想知道反向传播的概念、代码示例,建议问问大语言模型。

现在的深度学习都是用多层神经网络。神经网络也有缺点,有时需要手工调整参数,也就是排列组合出参数的值,得出一个较佳的模型。

图片

图来自:历史|从神经元到深度学习 - 知乎 (zhihu.com)

好了,这次讲到这里,后面会通过代码实现一个简单的模型。

没看懂的看官再去看一遍,遇到不懂的或感兴趣的知识点,多去向大语言模型提问,国内有文心一言、Kimi.ai - 帮你看更大的世界等问答机器人。

如果看懂了请点赞。

测试技术、质量管理、DeepLearning等咨询,请加微信:c593215873

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值