r语言 去除双引号_R语言的槽点(持续更新...)

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言数据高效处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书,《R语言数据高效处理指南》(黄天元)【简介_书评_在线阅读】 - 当当图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

由于长期使用R语言,R语言的种种便捷和痛点都有很多认识,是时候总结一下。欢迎各位朋友评论区补充,也许有的地方只是我们了解不够,有的地方则有人可以直接解决掉,这个帖子提供一个交流平台,我自己先来吐槽一番:

1、安装用install.packages,加载用library,难道有人会library而不需要下载吗?而且install.packages需要加双引号,library的时候就可以不加。我希望以后能够用:

library(tidyverse,data.table,fst,...)

当然现在就在用pacman包(CRAN - Package pacman),就还好。

2、超过屏幕的data.frame要一直输出到很多才报停。

290a0df0adb7372c4ad666b8fccd90d4.png

一般用户也不太有办法翻上去吧...幸好现在有了tibble(CRAN - Package tibble)。

3、帮助文档不能直接显示图片,这对于很多作图的包来说是不合适的,不过最近好像看到有的帮助可以显示图片,不知道是不是真的。不过其实R的帮助已经很给力了。

4、R语言要用一个包超级简单,但是要写一个包相对来说还是很难的。很多东西要查要记,一个环节不对就会出错。

5、很多包没有教程,只有各个函数的文档,这样在信息爆炸的时代就不利于延续。

6、因子变量是个让人很头大的数据类型,其实很多时候我们使用字符型会更好。稍微不注意,就会掉进坑里。

7、最灵活自由的列表(list)数据类型,会用的人其实很少,我也不熟。

8、R语言要想编写函数来做包,有很多新老概念需要了解,最近发现了2个不错的帖子:

https://edwinth.github.io/blog/dplyr-recipes/;Non-standard evaluation, how tidy eval builds on base R。

看的时候感觉挺好的,但是完全记不住,估计以后还是要过来看的,也可能还是看不懂。

9、做文本挖掘,如果有非常长的字符串,可千万不要随便去看里面的内容,不然随时会崩。

10、R版本和包的升级都很迷,很多时候不知道自己是不是在用最新的版本,加上错综复杂的依赖关系,可能会出现一些坑。比如你用的包的依赖包更新了,这个包就会报错。

抛砖引玉,欢迎补充~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值