2021-07-18-CSDN博客

本文链接：https://blog.csdn.net/Qsinsong/article/details/118879662

写在最前

将学习路径以博客的形式记录下来应该是个不错的选择，一方面促进学习的自觉，另一方面我也可以在记录过程中总结消化所学的内容。因此，我将把我接下来全部的学习过程变成一篇一篇的博客。希望自己可以坚持下来。

一点思考

接下来两年的研究生生活，我将义无反顾地跳进深度学习这个大坑，所以近一段时间我了解了很多相关的知识内容。
有一点我所关注的今天突然有了一点思考。
深度学习自从2012年AlexNet那篇文章开启新一股热潮以来，发展到现在好像出现了一点点的瓶颈。具体表现上大概是过度依赖标注数据集、对遮挡或者加了对抗的图像敏感等等。我的导师所研究的小样本学习或许是直面这个瓶颈的一个有效方向。
我在偶然思考这个问题的时候想，如果类比人类对图像的处理，目前深度学习或者计算机视觉对图像的处理是不完整的。我们识别一个物体，好像在瞬间就完成了整个识别过程，但细想下来，可分为三个步骤。

消除形变影响
提取特征
构建相关联想

人眼中的世界是有固定大小关系的，我们从出生到现在见过的苹果、人、树都是差不多这么大；我们有近大远小的概念，知道远处看不清表情的人和之后拥抱的人都是同一个人。但是计算机视觉中并不这样认为，一个高清的图片和一个低像素的图片虽然都能通过卷积那些操作提取出特征，但MNIST和ImageNet中得到的特征向量维数是有较大差距的。人类与计算机一个可以宏观把握，一个只能微观积累。初次之外，人类在识别特征之前，也先做了物体分离的操作。站在自行车前的猴子和自行车应该先分割成两个物体再进行特征提取，而不是直接把二者的特征向量合在一起去进行判断。还包括旋转、偏移、残缺等等，都可以笼统的归为形变影响，人类是先消除或至少理解了形变影响之后再进行特征提取的。而当前两步得到的结果致信率不高时，才会用到第三步来考虑周边事物的影响，也就是一般意义上的人骑车而不是猴子。
这些只是今天的一点瞎想，我所了解的还太少太少，如有错误还请包涵，我目前只能算是刚刚入门。

接下来的规划

从大往小了说吧，能提高生产力的技术一定会在未来有用武之地，当今计算机的热潮也是因为技术本身提高了生产力，那么生产关系也就自然而然地改变了。所以这一条宽广的大路我一定会走下去，我需要思考的是我能不能走下去和我怎么走下去的问题。
短期来看，我在研究生阶段需要确定我究竟是莽一莽冲算法工程师，还是转线去搞开发这件事。因为我的研究生只有两年很快，所以我最晚需要在明年六月份之前确定。而目前，我将全力实现我的Plan A，除非当某一天被现实打败再去考虑B。
而眼下，我刚刚才会怎么写markdown，接下来应当系统处理几个问题。包括几个经典论文的笔记、深度学习等发展历程的整理和理解、实验室老师和师兄师姐们论文的阅读和记笔记、vscode的使用技巧、葛师兄交代的任务这些。