【李宏毅机器学习特训营】完结撒花！

最新推荐文章于 2024-05-22 17:57:05 发布

_小十三

最新推荐文章于 2024-05-22 17:57:05 发布

阅读量242

点赞数

分类专栏：学习笔记文章标签： paddlepaddle

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44726859/article/details/115971837

版权

学习笔记专栏收录该内容

5 篇文章 1 订阅

订阅专栏

目录

一、我的作业
二、学习情况
- 1. 自行搭建模型
- 2. 自行封装数据集
三、遇到的困难
- 1. 对模型的理解不足
- 2. 数据集调用
四、谈谈收获

一、我的作业

作业1-PM2.5.
作业2-年收入判断.
作业3-食物图片分类.
作业4-语句分类.
作业5-迁移学习.
(课程链接).

二、学习情况

这是第二次完整的参与百度飞浆，距离第一次参加(第一次Paddle深度学习训练营之旅)已经过去了快一年的时间。实际上这次课程期间自己并没有太多时间完成任务，之所以坚持下来了，是因为自己在学校里刚好学了一门叫做《模式识别》的专业课，飞浆的这次特训营刚好和我课内知识互补，并且提升了我的实际动手能力

在第一次参加课程的时候，更多的是对已有的模型进行迁移和微调，很少自己去搭建，使用的数据集也是经过了paddle的封装，可以通过API直接调用的

这一次学习有了很大的不同，主要体现在两个方面：

1. 自行搭建模型

从回归问题到分类问题，从最基础的线性分类器开始，到简单的CNN网络，在CNN的基础上进行改进的AlexNet网络，再到后来的RCNN网络。每一步都需要自己动手搭建，并且对网络参数进行一步步的计算，在这个过程中加深了对网络结构的理解

除了网络结构需要自己搭建，train函数以及test函数也需要自行定义（或者熟练掌握paddle内置的调用方式，我选择的是自己定义）。

（具体的在作业里都有说明，这里就不赘述了）

2. 自行封装数据集

随着课程的展开，一度有这样的感觉：

“难的不是搭建网络，而是对数据进行处理”

当然这样的感受是针对与跑通模型来说的，如果想要调优，提高准确率的话，肯定还是搭建网络更难

如何对原始数据进行处理，如何使用小批量数据训练网络，如何在训练时正确的调用自己封装好的数据集…等等等等问题是我大部分时间消耗的地方

三、遇到的困难

对于我来说，最大的问题主要有两个方面，恰好也是对应了上面提到的两点：

1. 对模型的理解不足

虽然自己可以说是零基础，但是在第一次参加集训营的时候，对于CV方面是有基础了解的。所以在处理图像分类问题时，基础操作并没有遇到太多问题。而NLP，是我完全没有接触过的，所以在使用循环神经网络进行语句分类时，难度成几何倍数增长
另外，迁移学习也是一个知识盲区，在有限的时间里，并没有很好的理解透彻

2. 数据集调用

说起来就心痛，怎么也想不到，我会有百分之八十以上的时候是在对数据集进行处理，各种各样的数据格式错误，在numpy和tensor之间来回转化的迷茫…

四、谈谈收获

时间很短，很多的内容都没来得及细细的琢磨理解透彻，但是对于我而言，这次的课程收获还是很大的。只有系统化的自己动手写过代码，才能清晰的知道每一步的艰难以及重要性。数据是深度学习的基础，只有对数据完成了处理，才能开启一整套“流程”。搭建好了网络不是项目的结束，如何利用自己搭建的网络进行训练和预测，如何迭代更新参数，也是不得不一点点debug的过程

闲话到这里就结束了，还有最后的比赛，对baseline微调一下就会提交作业。作为考研人，要开始全心全意投入考研中啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【李宏毅机器学习特训营】完结撒花！

李宏毅机器学习特训营，paddle第二次课程，完结撒花
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。