写在结业的尾巴
前言
作为一个电子专业出身的萌新,在毕业之后阴差阳错成为了一名cpp后端。在4年后,同样的机遇,我偶然间看到了飞桨在AI大赛中卓越的表现,去官网才知道有这么一个课程活动,大佬带队,全方面陪伴。久旱逢甘霖,平常听到"AI"、"算法"等平常觉得高大上的词汇,这里将不再陌生。
第一次接触
作为一个互联网时代的新兴程序员,在知乎和CSDN,乃至StackOverFlow都有听说过一些有关于神经网络的词汇,大多会理解一下。
但是,我发现自己仍然缺乏一个端到端的认识和理解。这门课提供了一系列经典的示例,源码都直接po出来了。让我一看就懂,配合强大的notebook系统(后期高级运行环境的紧张使用情况太真实了)一跑就通。
在这里我学到了AI的几个主要应用类别,分别是计算机视觉,计算机语音,自然语言处理,还有推荐算法等。
《预测房价》这个例子本身是一个非常好的线性数据集合,有历史数据可以验证。对于AI算法来说,模型又足够简单,关于梯度的计算以及前向后向传播都能很好的理解,说明课程设计者真的下了深功夫了。
在这一章,我明显地感受到了AI的真正流程是什么。
AI的一个标准工业应用步骤如下
- 数据处理,从本地或者网络读取数据并完成预处理,这里主要解决数据之间的兼容格式问题
- 模型设计,设计神经网络模型,这一块对loss的效果提升最显著,立竿见影
- 训练配置,选取合适的优化器与学习率,万事不决用adam
- 训练过程,迭代模型,计算参数并且优化,包括前向计算、损失函数、后向传播等三个步骤
- 模型保存,把模型保存下来,在需要预测时进行调用
之前我的感受是,AI仅仅是一个高阶模糊控制算法,给定一些历史数据,然后自动训练出一个高阶函数,这个函数内部的参数是自适应的;后期慢慢深入之后,才发现AI不仅仅是AI。
来了来了,CV
如果说上一章的目标是了解AI模型训练的几大步骤,在这一章,老师开始深入各个环境,带你全方位提升模型的效果,此时一些经典的CV应用场景尽在掌握,学完了这一章,我跃跃欲试,自己突然蹦出了一个idea,想信不久时日就能在paddlepaddle上实践出来了。
- 数据处理,封装成一个函数,使用多线程操作,完成数据的快速读取
- 模型设计
- 网络结构, 采用更
- 损失函数
最后
推销一波飞桨系列的链接,欢迎更多有兴趣的人一起来学习,一起把握未来。
AI Studio:https://aistudio.baidu.com/
飞桨官网:https://www.paddlepaddle.org.cn/
百度技术学院:http://bit.baidu.com/index