针对Excel数据某字段符合条件的内容,修改另外一个字段对应的数值(R与Python对比)
还是工作上遇到的问题,做Excel的“表哥”做了这么久,才试着用R和Python来提升效率,说来真惭愧,但是一旦接触了就好像打开了潘多拉的盒子,一发不可收拾(希望真的是这样,坚持下去。。。)
好了,废话不说。现在工作上遇到的一个问题背景是这样的:因为商品的ID与单价,需要根据最新的情况来修改,过去都是在excel上筛选出来再vlookup来做,做完还得重新算其他相关列的数据。
以下是用R和Python来实现这样的需求,直接上代码和注释。
(总结:对比下来,R的运行效率高太多了,可能是专门对excel这种数据的关系,或者是本人对Python功力低下的原因,如果有高人指点改进改进,随时欢迎!!!)
先来R 的:
#R语言脚本
#安装用到的包
#install.packages("sqldf")
#devtools::install_github(c("ramnathv/htmlwidgets", "smartinsightsfromdata/rpivotTable"))
#install.packages("plyr")
library(xlsx) #常规的写xlsx的库,但是对比openxlsx效率欠佳
library(readxl) #常规的读readxl的库,效率比openxlsx快,但是有的字段格式出错
library(reshape2) #一些透视功能的函数依赖的库,如melt a