性能优化技巧 - 遍历

润乾软件

于 2019-06-03 16:59:54 发布

阅读量573

点赞数

分类专栏：集算器文章标签：性能优化遍历集文件组表

本文链接：https://blog.csdn.net/raqsoft/article/details/90754646

版权

本文详细探讨了数据遍历的优化技巧，包括存储方案的选择（集文件、行存和列存组表）、并行遍历的实现、过滤条件的优化、预过滤、游标取数策略以及遍历复用。通过实例分析，展示了如何有效提高遍历效率，降低计算成本。

摘要由CSDN通过智能技术生成

【摘要】
数据分析场景中，充斥着聚合运算，常见的有求和、计数、均值、最大最小值等等，想要得到正确的结果值，遍历技术必不可少，如何更加高效地对数据进行遍历？点击：性能优化技巧 - 遍历，来乾学院一探究竟！

1. 存储方案

集文件是行存方式，组表有行存和列存两种方式。两种格式都有一定压缩效果。

首先，我们来建立一个的普通的文本文件，并在该文件中生成一些数据，代码如下：

	A	B
1	=file("txt/employee.txt")
2	=file("info/ming_en_female.txt").import@i()	=A2.len()
3	=file("info/ming_en_male.txt").import@i()	=A3.len()
4	=file("info/xing_en.txt").import@i()	=A4.len()
5	=city=file("info/city_en.txt").import@i()	=A5.len()
6	=salary=20000	/10000~30000
7	=["one","two","three","four","five","six","seven","eight","nine","ten"]	=A7.len()
8	=height=50	/160~210cm
9	=weight=50	/50~100kg
10	=birthtime=946656	/1970~2000
11	for 100	=to((A11-1)100000+1,A11100000).new(~:id,if(rand(2)==0,A2(rand(B2)+1),A3(rand(B3)+1))+" "+A4(rand(B4)+1):name,if(A2.pos(name.array(" ")(1)),"Female","Male"):sex,A5(rand(B5-1)+1):city,date(rand(birthtime)*long(1000000)):birthday,rand(salary)+10000:salary,A7(rand(B7-1)+1):level,rand(height)+160:height,rand(weight)+50:weight,if(rand(2)==0,A2(rand(B2)+1),A3(rand(B3)+1))+"&"+A4(rand(B4)+1)+" Co. Ltd":company)
12		=A1.export@at(B11)