数据调研
声明:本博客只是一个门外汉的粗俗理解以及提问,不具有可靠性。
研究目标: 通过机器学习,完成产量预测。
远大目标: 通过产量预测,设计一个普适的模型。(针对约束满足问题设计模型?)
目前仅仅做了少量的文献调研。主要有以下想法:
1 问题的分析
将问题从简单到复杂来分析。
阶段1.注水量、生产量
可以先把问题先简化描述为 寻找注采关系的问题。
简单来看,可以认为注水井的注水量与周围的某k个生产井的生产量在某时间段内有一定的线性关系。为获取最优注采数据,只需拟合这一线性关系,则可以完成预测,找到最优的注采井对。
阶段1的数据细化则是油气比、含水率、采收率等。
阶段2.加入注水压力、产井压力
并非每次注水都会将所有生产井打开生产(对于不生产的井,压力数据则是必要的),对于所有井,压力特征是必要的。
数据则包括了生产井的静态压力、流动压力,注水井的注水压力。
阶段3.加入渗流数据
可以直接观测到的还有渗流数据,体现了注水在地层的流动情况。
阶段4 .……
后续纳入更多的条件(如生产措施、井类型等)进行认识和考虑。机器学习就是要将所有可能的信息条件纳入考察范围。
2 研究过程(?)
1).分析多组生产井和注水井在相同时间段中的注采数据,关注数据的类型、域。
2).建立模型,学习数据间的特征。
3).产量预测,验证,模型优化(回到步骤1)。
3 补充
之前和师兄交流,颇有收获。
1).考虑滞后性的问题
研究过程中还应该关注滞后性问题。个人理解是任何操作不一定会在第一时间对生产产生影响。(滞后性是否可以直接由渗流数据得到?)
2).注意对历史数据的分割
因为历史数据中,某些操作会对生产造成巨大的影响。该变化是否需要纳入到模型的学习过程中 还是 分隔为不同的阶段?这需要根据实际的研究来确定。
4 提问
问题1.在本次研究中建模和机器学习的关系?
问题2.压力数据为单井数据的单井是什么意思?实验时,是否可以把同一时间段内领近的某k个井看作同一个井组?