本节说一下数据的预加载。这节的内容与SQL没什么关系。主要说的是在 GIX4项目 中,我们是如何设计符合需求的预加载类库的。内容如下:
- 什么是预加载,为什么要用它?
- 我们所需要的API
- 一个简单的例子
什么是预加载?
预加载其实就是在真正开始使用数据之前,先异步把数据加载好,等到需要使用时,就可以直接使用之前加载好的数据。这时,由于数据已经加载完成,而不用等待漫长的加载过程,所以程序的速度得到一个明显的提升。
那么,什么时候需要使用它呢?我觉得,主要是这种情况:当我们可以预知程序接下来的步骤中,很可能会用到一些数据,而获取这些数据的操作比较耗时的时候,我们就可以使用预加载的方式,提前把数据准备好。
预加载需要使用异步方法,也就是使用后台线程来加载数据。这样做的好处当然是不会阻塞当前的主线程。(不过如果当前线程本身就是用于异步加载数据的话,那就没必要再新开线程了。)
我们可以使用很多种方式来实现异步加载:在.NET Framework的类库中,很多地方都提供了异步编程模式(Asynchronous Programming Design Patterns)的API,使用这个模式,可以方便地实现各种异步加载。当然,我们也可以使用2.0提供的ThreadPool.QueueUserWorkItem来实现一些轻量级的异步操作。在.NET4.0最新的API中,提供了Task类来表示可执行任务。
但是,这些并不是我想要的API……
我们所需要的API
目前系统中预加载使用的场景需求是这样的:
- 预加载可以对指定的数据获取操作(loading action)进行封装,在需要时调用。
- 使用数据的模块(使用者),并不一定知道是谁、在何时给它提前加载的数据。它只会申请使用数据。
- 发起异步加载的模块(发起者),应该知道使用者是谁。
- 多个发起者之间没有关系,但是都可以为某一使用者发起预加载。但是保证真正的数据加载操作,只会发生一次。
- 支持重新加载。
- 一个类中,支持对它不同的数据进行不同加载方式,以方便按需加载。
- 从使用者的角度来看,不管有没有发起者为它进行预加载,它都可以申请并拿到想要的数据。也就是说:
当没有发起者为它进行预加载,那么它的数据申请会导致即时的数据加载;
如果已经发起了预加载,而且数据已经加载完成,则直接获取到加载好的数据;
如果数据没有完成,则数据使用者需要等待数据的加载完成后,才可以获取到数据并继续当前的操作。
其中,最重要的就是最后点。
可以看到,这里需要用到异步操作、线程间同步。所以我们需要基于上面提到的多种API来实现,这里我们使用的是简单的线程池的方式,比较简单,不再赘述。
最后设计出的API大致是这样的:
namespace OpenExpressApp { public enum LoaderStatus { NotStarted = 0, Running = 1, Completed = 2, Failed = 3, } public class ForeAsyncLoader { public ForeAsyncLoader(Action loadAction); public LoaderStatus Status { get; } public event EventHandler ActionSucceeded; /// <summary> /// 申请启用线程进行预加载。 /// 注意: /// 本方法可以重入,多次调用也只会执行一次ladAction /// </summary> public void BeginLoading(); /// <summary> /// 重设加载器。 /// 使用此方法后,再次申请预加载时,会再次执行loadAction。 /// </summary> public void Reset(); /// <summary> /// 等待数据加载完成。 /// </summary> public void WaitForLoading(); } }
例子
客户程序使用时,需要为其定义一个属性,举例如下:
数据持有者:
public class DataHolder { private object _data; public object Data { get {
return this._data; } } private object GetDataFromWeb() {
//...
}
}
如果它的data1数据加载比较慢,我们可以为其定义一个预加载属性:
private ForeAsyncLoader _dataLoader; /// <summary> /// 数据加载器
/// </summary> public ForeAsyncLoader DataLoader { get { if (this._dataLoader == null) { this._dataLoader = new ForeAsyncLoader(() => { //真正加载数据 this._data = this.GetDataFromWeb(); }); } return this._dataLoader; } } 这样,数据的“消费者”就可以使用这个数据:
public class DataConsumer { private void Process(DataHolder holder) { holder.DataLoader.WaitForLoading(); var data = holder.Data;
//consume data...
} }
在这里,虽然使用者并不知道有没有其它代码给holder执行了数据的预加载,但是当WaitForLoading方法执行完成后,数据是必然获取到本地了。所以就可以直接使用数据。我们甚至可以把这句代码放在Data属性的get代码块中,这样,使用者甚至都不知道数据的获取方案!
然后,可以在运行于它之前的代码中,为这个“DataHolder”申请预加载。例如,我们在应用程序启动的时候,就开始预加载。下面的方法调用了BeginLoading方法,此方法会使用后台线程加载数据,所以这里会立即返回:
public class Invoker { private DataHolder _holder = new DataHolder(); private void App_Start() { this._holder.DataLoader.BeginLoading(); //do other things } } 至此,就完成了一个最简单的预加载。
过程如下:
(图画得不熟,哪画错了,望大家指正,谢谢。)
小结
本篇主要说了一下在目前的系统中,如何设计出一个满足场景应用需求的预加载API。
预加载是一个经常会被使用到的模式,希望对大家有用。
下一篇我会写一下与目前系统关联比较大的内容:与GIX4对象模型相关的“预加载、延迟加载、聚合SQL的组合应用”;另外可能会顺便说一下,如何让CSLA的服务端框架支持多线程并发。