2019年第 13 篇文章,总第 37 篇文章
无论是研究方向是 AI 方面的学生,或者是做机器学习方面的算法工程师,在掌握基础的机器学习相关知识后,都必须掌握搜索论文的技能,特别是研究或者工作领域方向的最新论文,更进阶一点的技能,就是可以复现论文的算法,这是在论文作者没有开源代码的时候的一个解决办法,但是在能够掌握这项技能前,我们希望能够搜索到其他人复现的代码。
因此,今天我会推荐两个相关的网站,并且都是同个团队的成果,这个两个网站,一个可以用于展示带有代码实现的论文算法,另一个给出了多个领域最新最好的算法论文结果。
1. Papers with Code
首先给出这个网站的网址:
https://paperswithcode.com
这是 Reddit 的一个用户 rstoj 做的一个网站,将 ArXiv 上的最新机器学习论文与 Github 上的代码(TensorFlow/PyTorch/MXNet/等)对应起来。相比之前推荐的阅读 ArXiv 的网站,这位用户做出了满足更多研究者的最大需求--寻找论文算法实现的代码!
这个项目索引了大约 5 万篇论文(最近 5 年发布在 arxiv 上的论文)和 1 万个 Github 库。
你可以按标题关键词查询,或者研究领域关键词,如图像分类、文本分类等搜索,也可以按流行程度、最新论文以及 Github 上 Star 数量最多来排列。这个网站能让你跟上机器学习社区流行的最新动态。
首先是看下这个网站大概长什么样的:
上图给出的是按照流行程度来排列,对每篇论文给出了题目、作者、投稿的会议或者顶会,一些简介,比如是否当前领域最先进算法,标签(即关键词,论文研究的方向)和采用的代码框架(比如是 Pytorch 还是 TensorFlow 或者其他框架),论文和代码链接,还有当前 Github 的 Star 数量,以及每小时增加的 Star 数量。
如果是按照 Github Star 数量最多排列,如下图所示:
可以看到最多 Star 数量前两位都是 TensorFlow ,第三位是 Caffe 框架。
另外,如果我们在搜索框输入研究领域的关键词,比如图像分类--Image Classification,搜索结果如下所示:
它会展示当前包含该领域带有论文的共 250 篇论文,然后是展示几个数据集上效果最好的算法和论文,以及开源项目(如果开源了),然后就是子领域--Subtasks,最后是该领域的有代码的论文,按照 Github 上 Star 数量来排列。
2. Browse state-of-the-art
同样先给出网址:
https://paperswithcode.com/sota
这个网站主要是解决另一个问题--寻找一个领域目前最好的(State of the art, Sota)算法的论文以及实现代码。这也是刚接触到一个新领域时候,必须要做的事情,先找到最新最好的算法论文,然后根据这篇论文的代码实现,先跑下代码,接着再去了解细节,或者是根据它的参考论文,来学习这个领域最近几年的论文(一般是 3 年到 5 年内的),逐渐熟悉这个领域的研究方向和难点所在。
还是 Papers with Code 的团队做出了一个可以查询领域最新算法的网站,它总共包含了 16 个大类,950+的单独子类任务,500+个评估结果(包含 Sota 结果)、700+数据库,8000+论文。如下图所示:
16 个分类包括:
计算机视觉
自然语言处理
医疗
研究方法
杂类
语音
游戏
图(Graphs)
时间序列
音频
机器人
音乐
推理
计算机编码
知识库
对抗性(Adversarial)
点击计算机视觉这个大类,可以看到具体又划分了450+个子任务,如下图所示:
这里可以继续点击进去每个子任务,比如图像分类,然后会得到如下图所示:
上图其实就是在刚刚介绍 Paper with Code 网站时候,介绍搜索领域关键词例子中的图例了。
最后,再给出两个网站的网址:
https://paperswithcode.com
https://paperswithcode.com/sota
有了上述两个网站帮助,相信可以帮助大家更好的去学习和熟悉研究领域方向的工作了!
如果你觉得这篇文章对你有帮助,或者写得不错,请给我点个好看,谢谢!
欢迎关注我的微信公众号--机器学习与计算机视觉,或者扫描下方的二维码,大家一起交流,学习和进步!