arXiv 是一个收集物理学、数学、计算机科学与生物学论文预印本的网站。
对于理科生来说,经常需要在上面搜索下载一些论文,正常情况下,一般人下载的只是 pdf
文件,其实可以在 arXiv
上下载编译成论文的 LaTeX
源文件。
- 首先我们打开 arXiv ,搜索想要搜索的论文,或者搜索
arXiv
预收录时的编号(如:arXiv: 2003.03808,最近很火的PULSE)
-
进入文章详情页面就可以看见侧边栏的
Download
了,此时有两种方式可选
PDF
选项很显然是下载PDF格式的文件,如果想获取源码的话,需要选择Other formats
- 仔细看这一行的描述就知道点击
Download source
就能得到我们想要的资源了
- 下载下来的是一个无格式的文件
通过描述Delivered as a gzipped tar (.tar.gz) file if there are multiple files, otherwise as a PDF file, or a gzipped TeX, DVI, PostScript or HTML (.gz, .dvi.gz, .ps.gz or .html.gz) file depending on submission format.
就可以知道下载下来的应该是一个压缩文件
通过更改文件名,把后缀名改成gz
或者zip
等压缩格式,这里以zip
为例,并解压
- 打开解压后的文件夹,在根目录找出
tex
格式文件中的主文档
一般判断文件是否是主文档的方法比较多- 文件名称:
main.tex
,paper.tex
或者相应的论文名简要缩写 - 看文档体积:一般是体积大的,一些论文排版编写的有条理时(分很多模块,然后在主文档导入),主文档体积可能会很小
tex
格式文件很多时或者文件名起的乱七八糟的让人分不清,这时候只能通过打开几个像的文档判断\documentclass[10pt,twocolumn,letterpaper]{article} \usepackage{cvpr} \usepackage{times} \usepackage{epsfig} \usepackage{graphicx} ...... 这种里面带有文档类型申明的就是主文档
- 文件名称:
-
用
TeXStudio
打开主文档,可以试着编译一下
这时就可以知道,这个资源是可以编译的。也有一些资源是不能编译的,是因为
LaTeX
对静态资源(图片,字体…)的路径、安装方式依赖很大,换台机器编译不了很正常。不能编译的话,我们也没必要尝试修复编译出现的问题,我们的目的只是想看看人家文档怎么组织,对比pdf
来说,也更容易利用浏览器使用CV
大法。
浅谈这种做法有什么好处?
-
对于学习
LaTeX
的新手来说,参考一些高级论文的排版规范,很容易更快的提高自己在LaTeX
上的排版能力,包括学习组织文件的模块化思想,公式、图片、表格的使用习惯和技巧
… -
有时可能会看见一些论文正文中看不见的知识
有的时候这些注释内容可能会加深对文章的理解程度,这一点比较好 -
更方便的复制内容,然后翻译(这一点好也不好)