在实际的生产中, 有多个时序数据. 因此有必要建议多时序模型.
1. 同步时序模型
将多个指标数据按月进行统计, 即每月一个数据点, 获得多时序函数:
f
:
A
×
T
→
R
(1)
f: \mathbf{A} \times \mathbf{T} \rightarrow \mathcal{R} \tag{1}
f:A×T→R(1)
其中,
A
\mathbf{A}
A 为指标的集合,
T
=
{
1
,
2
,
…
n
}
\mathbf{T} = \{1, 2, \dots n\}
T={1,2,…n}, 典型地,
A
=
{
p
s
,
f
p
,
w
t
,
p
d
}
\mathbf{A} = \{\rm{ps}, \rm{fp}, \rm{wt}, \rm{pd}\}
A={ps,fp,wt,pd}, 即指标包括: 泵速 (ps), 井底流动压力 (fp), 日注水量 (wt), 日产量 (pd). 如:
f
(
p
d
,
1143
)
f(\rm{pd}, 1143)
f(pd,1143) 表示第 1142 天的产量.
机器学习任务, 就是根据该多时序预测 n + 1 , … , n + t n + 1, \dots, n + t n+1,…,n+t, 应该有现成的模型可以做.
表 1. 油田时序数据
已开采天数 | 泵速 | 井底流动压力 | 日注水量 | 日产量 |
---|---|---|---|---|
1143 | 30 | 24.61 MPa | 200 m 3 ^3 3/d | 49.8 t/d |
1144 | 29 | 24.53 MPa | 198 m 3 ^3 3/d | 49.1 t/d |
1145 | 31 | 24.55 MPa | 201 m 3 ^3 3/d | 49.5 t/d |
… | … | … | … | … |
1218 | 40 | 17.21 MPa | 240 m 3 ^3 3/d | 28.1 t/d |
… | … | … | … | … |
这里的数据表面上看与 产量预测建模 2: 静态结构化数据模型 中的一致, 但我们将“已开采天数”作为时间, 是从时序的角度来处理. 换言之, 这里更注重纵向, 而不是横向.