从零开始的NLP科研（持续更新）

Odd Function

已于 2023-08-17 19:56:37 修改

阅读量185

点赞数 2

文章标签：自然语言处理人工智能

于 2023-08-01 00:11:50 首次发布

本文链接：https://blog.csdn.net/weixin_73179708/article/details/132032637

版权

都说万事开头难，良有以也。

本人目前大一暑假，跟导师做科研。本人纯科研小白，所以想在博客上记录一下自己从零到一的科研经历。一来是可以给其他入门的同学分享学习的心得，同时也避避坑，；二来也是可以给自己每天做个复盘记录吧。

怎么找到科研的？

本人大一一进来，也是对科研实习一窍不通。那时一心想卷绩点，就把时间花在课内的比较多。这导致实践的时间比较少。到了大一下期初，我感觉到光卷绩点边际递减效应太明显，而缺乏科研实习经历，所以想找点课外的事情干。实习干不了（毕竟也没有技术，没有企业要我），于是我便想从科研搞起。

所以我给大一上上导论课的导师写了封推荐信（他搞NLP的）。我先是在网上了解了一下实验室的情况，然后在信中问了：1.目前研究方向，2.有没有什么活可以干的，3.干活需要什么知识。并且信里面还贴上了大一上的成绩。

可能是因为大一上成绩比较好，导师第二天就和我面谈了。于是和导师简单聊聊之后，他安排了一个大四的师兄带我入门。他帮我规划了学习路线，说我按着这个路线先学着，然后学完差不多就可以跟他们做项目了。

（这个是我当时写的总结）

然后大一下就是跟着这个路线走了。但是由于课内真的比较繁重，大一下结束的时候也就刚刚把Python自学完了（笑）

然后就到了暑假，开始正式入门了。

暑假正式开始入门

终于到了暑假，有整块的时间搞了。这是师兄安排了一个新的路线：

人工智能学习 (notion.site)

于是我就正式开始了我的科研入门。

我先看的是鱼书

总体评价：

这本书真的是从零到一开始讲，很详细，很适合像我这样的小白。此外封面的鱼长得是真的好魔性hhh

学到了什么：

重点读了这些：

他一开始从Python基础开始讲。这部分由于我学过，就很快的过了。

然后讲Numpy和Matplotlib这些基本的库。我也跟着书上的代码敲了一遍，感觉不太难。

然后它从单层感知机讲到多层感知机，神经网络的架构。这是我看这本书的重点。大部分我都理解了，也跟着书上的代码跑了手写数字识别，自己改了点hyperparameter。至于反向传播算法还是没有太搞懂。不过我也跳了（因为用pytorch的有个backward真的是太香了）

还有看的比较多的是不同的optimizer算法。包括SGD,Momentum，Adam这些。期间Monentum不太懂，还去和实验室的师姐交流了一番。

CNN的架构和实现。

略读了这些：

权重初始化，Batch Normalization，正则化。

深度学习的那一个章节。

这些略读，一来是当时看不太懂，二来看懂了也不太会用。而如果不用的话，很快就会忘记，学了和没学一样。所以我想先学一下架构，然后知道这些细碎的知识在整个知识体系的什么位置，最后再在实践中把这些知识拼上去就可以了。（事实证明的的思路是正确的）

此外，在这个阶段还踩了个坑：

一开始我真的是从Python开始，然后用pip install一个个把库安上去。我配了好久，还遇到了各种各样的问题（说多了都是泪）。那时候还不知道可以Anaconda，也不知道可以用google colab白嫖算力和环境。（所以让我重头来一遍，我肯定不会傻傻的从零开始配环境）。大家千万不要学我orz

在这期间还帮忙实验室师兄调了调代码。好像是他一个论文要发表，然后他的代码有一些消融实验.所以让我先读他的论文，然后跟着他的论文把代码消融实验都去掉，最后能跑就可以。但是弄懂论文就花了我好多的时间，而且那个K临近算法我也不是很熟，所以我只将论文做了摘要，最后调代码还是师兄帮忙做的……(惭愧）