R与自动化报告

这里写图片描述 雪晴数据网

【演讲者简介】李舰
毕业于中国人民大学统计学院(本科)和北京大学软件与微电子学院(研究生),现就职于堡力山集团,担任副总。是Rweibo、Rwordseg、tmcn等R包的作者,《数据科学中的R语言》的作者,还参与翻译了《R语言核心技术手册》和《机器学习与R语言》

【演讲摘要】
不论是学术界还是产业界,研究人员的分析成果都需要和其他人交流,这种交流的载体可能是文档、幻灯片、网页等。对于学术界来说,常常需要研究过程是开源和透明的,可以帮助其他分析人员独立地重现结果。但很多研究文档往往只有研究结果,而没有包括所有的研究过程。这很大程度上是因为做研究和写文档这二者之间经常是分离的。这样一来,其他研究者无法得到数据来源、数据分析过程等具体的信息。这样的研究结果难以被其他人所重复,前人的知识也没有很顺利地传递下去。解决这一问题的方法是“可重复研究”(Reproducible Research),谢益辉开发的knitr可以很方便地基于R将数据获取、数据整理、数据分析、结果展现等步骤内容全部整合到一份文档中,便于研究者管理也便于交流,也使得其他人能很容易地重现并理解作者的研究过程和结果。
在业界,我们可以基于knitr并结合markdown、LaTeX、html5等工具生成非常漂亮的报告。在本次演讲中将会介绍这些方法的特点与使用方式,通过示例来展示不同的结果。此外,业界对于PPT格式的报告有很强的偏好,尤其是国内的使用习惯下喜欢使用复杂的PPT模板。基于这样的需求,演讲者开发了Rofficetool包,本次演讲将会重点介绍该包的开发背景及使用方法。

阅读更多
换一批

没有更多推荐了,返回首页