R语言和集算器进行简单的行间运算

最新推荐文章于 2024-01-02 09:36:12 发布

刨坑数据

最新推荐文章于 2024-01-02 09:36:12 发布

阅读量1.6k

点赞数

分类专栏：胡说八道文章标签：集算器 R语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012388497/article/details/22936975

版权

胡说八道专栏收录该内容

199 篇文章 0 订阅

订阅专栏

行间计算很常见，累计，同期比，环比这些都会涉及到。R语言和集算器都有很好的行间计算能力，但又略有区别。

下面这个案例涉及一些基本的行间运算，可以通过它说明二者的区别：

某公司的销售部门希望统计出优秀的销售员，即给公司提供前一半销售额的销售员。数据主要来自MSSQL数据库的订单表：salesOrder，主要字段包括订单编号：orderID，销售员姓名：name，销售额：sales，订单时间：salesDate。

比较直观的解法是：

1.先按销售员汇总，求得每个销售员的销售额.

2.将上一步的数据按照销售额逆序排序

3.在上一步中求各条记录的累计值。并求出比较标准：公司销售总额的一半。

4.找到上一步中累计值能符合以下条件的销售员的列表：小于等于比较标准；或者虽然大于比较标准，但上一个销售员是小于比较标准的。

R语言的具体解法是这样的：

01library(RODBC)

02odbcDataSources()

03conn<-odbcConnect("sqlsvr")

04originalData<-sqlQuery(conn,'select * from salesOrder')

05odbcClose(conn)

06 nameSum<-aggregate(originalData$sales,list(originalData$name),sum)

07names(nameSum)<-c('name','salesSum')

08orderData<-nameSum[rev(order(nameSum$salesSum)),]

09halfSum<-sum(orderData$salesSum)/2

10orderData$addup<-cumsum(orderData$salesSum)

11 subset(orderData,addup<=halfSum| (addup>halfSum & c( 0, addup[- length (addup)]) <halfSum))

下面是集算器的解法：

先看看计算累计值有什么不同：

R语言在line 10使用 cumsum求累计值。

集算器在A4格使用cumulate求累计值。

两者写法都很方便，但esProc的运算原理是针对每条纪录，先算一遍cumulate，然后按照行号#取得这条纪录对应的累计值。而R语言是只计算一遍，因此效率上比集算器高。

把集算器的这句拆成两句可以解决效率的问题，即先单独算累计值列表，再插入到原数据集中。但这种写法又不如只需要一句代码的R语言简练。

接着再看计算符合条件的销售员时有什么不同：

R语言在Line 11完成这项计算，主要用了移动行的办法，使用c( 0, addup[- length (addup)])构造了一列新数据。和addup这列相比，新列只是向下移动了一行，去掉了最后一条数据并补上了第一条的0。这样就可以进行比较了：累计值是否小于比较标准? 或者虽然大于比较标准但上一条纪录是否小于比较标准?

R语言不能直接访问相对位置的数据，所以采用了”让相对位置的数据移到当前位置”的办法，虽然效果是一样的，但这个写法不够直观，需要分析者具备较高的逻辑思维能力。

集算器的写法是select(addup<=B3 || (addup>B3 &&addup[-1]<B3))。非常简单清晰！这是集算器特有的相对位置表达方法，即可以用[-1]这种方法表示相对于当前纪录的前1条或后几条纪录。比如A4中的累计值的计算，也可以写成A3.derive(addup[-1]+salesSum:addup)。

和累计值的固定算法不同，这一步算法更自由，集算器的相对位置表达方式比较灵活。

通过上面的例子可以看到，相对位置和行间运算运算可以解决很多看似复杂的问题，集算器在表达相对位置时更灵活，因此在进行复杂问题计算时估计会轻松许多。R语言在整列整行的追加以及固定算法方面写法则更加简练。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
R语言和集算器进行简单的行间运算

行间计算很常见，累计，同期比，环比这些都会涉及到。R语言和esProc都有很好的行间计算能力，但又略有区别。下面这个案例涉及一些基本的行间运算，可以通过它说明二者的区别：某公司的销售部门希望统计出优秀的销售员，即给公司提供前一半销售额的销售员。数据主要来自MSSQL数据库的订单表：salesOrder，主要字段包括订单编号：orderID，销售员姓名：name，销售额：sales，订单时间：s
复制链接

扫一扫

专栏目录

刨坑数据 CSDN认证博客专家 CSDN认证企业博客

码龄11年

165: 原创

53万+: 周排名

130万+: 总排名

44万+: 访问

: 等级

6052: 积分

30: 粉丝

13: 获赞

15: 评论

73: 收藏

私信

关注

热门文章

分类专栏

最新评论

自定义数据源是报表开发的常态
Thinion: 这个工具有点厉害呢！
R读写Excel文件中数据的方法
并肩.op: 具体地址:https://blog.csdn.net/weixin_45686211/article/details/103177664
R读写Excel文件中数据的方法
并肩.op: j [code=plain] protected void Button1_Click(object sender, EventArgs e) { //获取文件路径 try { //先上传文件至服务器 string filename = this.FileUpload1.PostedFile.FileName; //判断路径是否为空 if (filename != "") { string extension = (new FileInfo(filename)).Extension; string newfilename = System.DateTime.Now.ToString("yyyyMMddHHmmss") + extension; string path = Server.MapPath("~/UploadFile/"); this.FileUpload1.PostedFile.SaveAs(path + newfilename); filePath = Server.MapPath("~/UploadFile/" + newfilename); if (filePath.Contains("xls"))//判断文件是否存在 { //执行导入方法 InputExcel(filePath); } else { Response.Write("<script>alert('选择的文件不是表格形式，或者格式不是xls文件格式！');</script>"); } }[code=plain] [/code]
实现birt报表跨库数据源的简单办法
weixin_43682864: Birt报表展现能力不错，但是几乎完全没有数据处理能力，需要依赖存储过程来完成。对于难度更高的数据处理需求，比如跨库运算，内存溢出等问题的解决，也有程序员专门写了Java代码来做前期数据处理，再把处理结果传给Birt展现。不管哪种方案，工作量都很大，而且效率很低。 <span xss=removed><u><a href="http://c.raqsoft.com.cn/article/1537155188168?r=KittyYan" rel="nofollow">《让Birt报表脚本数据源变得既简单又强大》 </a></u></span>这篇文章解决了Birt报表的数据处理难题，值得参考借鉴。
报表的数据组织：文件还是数据库？
脑子受了重伤: 原来是广告

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。