【李宏毅机器学习特训营】完结撒花!

一、我的作业

作业1-PM2.5.
作业2-年收入判断.
作业3-食物图片分类.
作业4-语句分类.
作业5-迁移学习.
(课程链接).

二、学习情况

这是第二次完整的参与百度飞浆,距离第一次参加(第一次Paddle深度学习训练营之旅)已经过去了快一年的时间。实际上这次课程期间自己并没有太多时间完成任务,之所以坚持下来了,是因为自己在学校里刚好学了一门叫做《模式识别》的专业课,飞浆的这次特训营刚好和我课内知识互补,并且提升了我的实际动手能力

在第一次参加课程的时候,更多的是对已有的模型进行迁移和微调,很少自己去搭建,使用的数据集也是经过了paddle的封装,可以通过API直接调用的

这一次学习有了很大的不同,主要体现在两个方面:

1. 自行搭建模型

从回归问题到分类问题,从最基础的线性分类器开始,到简单的CNN网络,在CNN的基础上进行改进的AlexNet网络,再到后来的RCNN网络。每一步都需要自己动手搭建,并且对网络参数进行一步步的计算,在这个过程中加深了对网络结构的理解

除了网络结构需要自己搭建,train函数以及test函数也需要自行定义(或者熟练掌握paddle内置的调用方式,我选择的是自己定义)。

(具体的在作业里都有说明,这里就不赘述了)

2. 自行封装数据集

随着课程的展开,一度有这样的感觉:

“难的不是搭建网络,而是对数据进行处理”

当然这样的感受是针对与跑通模型来说的,如果想要调优,提高准确率的话,肯定还是搭建网络更难

如何对原始数据进行处理,如何使用小批量数据训练网络,如何在训练时正确的调用自己封装好的数据集…等等等等问题是我大部分时间消耗的地方

三、遇到的困难

对于我来说,最大的问题主要有两个方面,恰好也是对应了上面提到的两点:

1. 对模型的理解不足

虽然自己可以说是零基础,但是在第一次参加集训营的时候,对于CV方面是有基础了解的。所以在处理图像分类问题时,基础操作并没有遇到太多问题。而NLP,是我完全没有接触过的,所以在使用循环神经网络进行语句分类时,难度成几何倍数增长
另外,迁移学习也是一个知识盲区,在有限的时间里,并没有很好的理解透彻

2. 数据集调用

说起来就心痛,怎么也想不到,我会有百分之八十以上的时候是在对数据集进行处理,各种各样的数据格式错误,在numpy和tensor之间来回转化的迷茫…

四、谈谈收获

时间很短,很多的内容都没来得及细细的琢磨理解透彻,但是对于我而言,这次的课程收获还是很大的。只有系统化的自己动手写过代码,才能清晰的知道每一步的艰难以及重要性。数据是深度学习的基础,只有对数据完成了处理,才能开启一整套“流程”。搭建好了网络不是项目的结束,如何利用自己搭建的网络进行训练和预测,如何迭代更新参数,也是不得不一点点debug的过程

闲话到这里就结束了,还有最后的比赛,对baseline微调一下就会提交作业。作为考研人,要开始全心全意投入考研中啦

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值