9、write_concurrency(并发写)
可以提高多进程并发写ets的效率,ets写数据时整张表是锁定的,其他进程不能进行读写直到前面的操作完成。
并发写可以改变这个情况,同一个表中的不同对象可以被多个进程并发读写。有了这个参数,使得ets写记录时锁表变成了锁记录,提高了并发读写效率。但并发写也有弊端,降低数据连续写入的效率和性能。如果有且只有一个进程在读写数据,将会带来一定的开销。而测试发现这个开销比较小,可以忽略。而且,只有一个进程在读写数据的场合比较小。
并发写的适用场合:
a. 数据并发读写很频繁。
b. 并发读写的数据量比较少(取记录数)。
c.一次性插入多条记录,ets要保证原子性,并发效率会降低。
10、read_concurrency(并发读)
优化ets并发读性能,特别是在多核smp的支持下,读操作变得比较廉价。但是同时也带来一个问题,读写操作之间的切换消耗更多的性能。
并发读的适用场合如下:
a. 读比写更加频繁。
b. 大量的读少量写,大量的写少量读。
11、什么时候使用这两个参数?
a. 使用write_concurrency参数大多时候是有效的,测试写操作性能提高3~4倍,而且,在单进程写多进程读的场合下也同样适用。
如果并发读写次数较少,而且每次都要读取或者写入大量数据就不适合了。
b. read_concurrency的使用要看场合,并不是高并发就适合。如果每次读的数据和写的数据都很少,而且读写都很频繁,就没必要使用这个参数。如果很少写数据,大多时候都是读数据的话用这个参数就很适用了。另外,如果数据读写频繁,但每次读写的数据都很多,也适当考虑用这个参数。
12、 ETS的效率
a. 在内部,ETS表是用散列来表示的(除了ordered set是用平衡二叉树来表示的)
所以set有点浪费空间,ordered set有点浪费时间。set表插入数据所耗费时间是常量,而order set插入所耗时间与表的大小成对数关系。
bag比duplicate bag的使用代价要高,因为每次插入都要比较键值。
b. ETS表与正常的进程存储空间分离,不会进行垃圾回收。
c. ETS表隶属于创建他的进程,当这个进程死掉或者调用ets:delete,这个表就被删掉。
d. 在进程之间发送大量二进制数据的消息,或者向ETS表中插入包含二进制数据的元组,代价都很低。因此,尽可能地用二进制数据表示字符串或大块的无类型数据,是一种高效的编程方式。